先说下我亲测的一些心得
默认转化后的语言是英文 记得要改成chinese
音乐不能转化,比如我截图前面是一首beyond的歌 就无法转化出来文字
转化速度还不错。选择模型的话 第一次需要下载模型到本地可能会要几分钟,后面就是离线操作了 速度很快
Buzz 功能
导入音频和视频文件并导出文本到 TXT、SRT 和 VTT
从你计算机的麦克风转录和翻译成文本(资源密集型且可能不是实时的)
支持Whisper、 Whisper.cpp、Faster Whisper、 与Whisper 兼容的 Hugging Face 模型和OpenAI Whisper API
适用于 Mac、Windows 和 Linux
应用场景
会议现场录音,同步转文本。
将视频语音转成TXT、SRT、VTT
支持格式Audio files (*mp3 *.wav *,m4a *ogg) 、Video files (*.mp4*.webm *.ogm *.mov)
看看
谢谢分享
谢谢分享
好东西
好东西