简介
一个基于 OpenAI Whisper Large v3 模型的高速音频转文字工具,能够在不到 98 秒的时间内转录 300 分钟(5小时)音频。
适用于多场景,支持 100 种语言的转录并支持翻译功能,提供按词或片段生成时间戳文本,方便字幕制作。
提供命令列界面(CLI),也可以通过 Whisper API 进行线上语音转文字。
网址
https://github.com/Vaibhavs10/insanely-fast-whisper
https://replicate.com/vaibhavs10/incredibly-fast-whisper