3 часа подкастов/видео, 15 минут на выделение сути.


Написал для Claude Code навык, достаточно вставить ссылку — поддерживаются 小宇宙, YouTube, B站, полностью на английском и китайском.
Три AI модели работают независимо:
• Claude отвечает за управление всем процессом
• Whisper преобразует аудио в текст
• Gemini обрабатывает длинные тексты до 5万 слов, выводит структурированные резюмы
Самое интересное — способы получения аудио на трех платформах полностью разные. 小宇宙 самый простой, аудио-ссылка спрятана прямо в исходном коде страницы. YouTube имеет антибот-защиту, нужно немного обойти. B站 — самое сложное — стандартные методы заблокированы, в итоге пришлось напрямую обращаться к его низкоуровневому API, чтобы получить аудио.
На практике протестировал три видео (см. изображение): 117мин + 181мин + 114мин, все успешно прошли. Самое длинное — 181 минута, транскрипция более 5万 слов.
Раньше 3-часовой подкаст можно было только слушать или не слушать, теперь появился третий вариант: сначала посмотреть выделенные моменты, а при необходимости — вернуться и прослушать оригинал.
Посмотреть Оригинал
post-image
post-image
post-image
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
  • Награда
  • комментарий
  • Репост
  • Поделиться
комментарий
0/400
Нет комментариев
  • Закрепить