音视频转文字、字幕小工具V1.2是一款基于OpenAI Whisper的衍生项目Faster Whisper做成的一个专注于音视频转文字、字幕的小工具,支持100多种语言的识别和翻译。
Faster Whisper利用Whisper的语音识别技术,将音频或视频中的语音转换成文本,并进行翻译,以满足用户在不同场景下的需求。
由于集成了whisper的whisper desktop、buzz两个模型,所以工具有点大,达到了8G。
Faster Whisper的特点:
1. 高效的语音识别:基于OpenAI Whisper的深度学习技术,能够准确地识别多种语言的语音内容,并将之转换为文本。
2. 多语言支持:支持100多种语言的识别和翻译,使得用户在处理不同语言的音视频文件时,能够更加方便快捷。
3. 快速翻译:利用Whisper的机器翻译技术,能够在识别语音内容的同时,将之翻译成目标语言,大大提高了翻译效率。
4. 适用范围广:Faster Whisper不仅可以应用于音频文件,还可以处理视频文件,满足用户在不同场景下的需求。
5. 用户友好的界面:Faster Whisper提供了一个简洁明了的用户界面,使得用户能够快速上手,轻松使用这款工具。
使用教程
1.解压文件,点击“音视频转文字字幕小工具V1.2.exe”即可使用。
2.将要转换的音频或者视频文件,放在一个文件夹里。点击“待转换的音频/视频目录”,选择放置音频或者视频文件的文件夹。
3.选择翻译成的语言。
4.选用设备。支持英伟达显卡和CPU。若选择显卡,提示失败的话,可以更换为CPU。
5.模型选择,推荐选择whisper-lagge-v2。
6.计算精度,新显卡默认float16,老显卡建议选择用int8,使用CPU设备则无所谓。
7.点击“开始转换”就可以了。转换完成后,点击工具界面的“打开输出目录”按钮,或者打开程序所在的文件夹,找到“识别结果”文件夹,就可以看到结果。里面有两个格式,一个是srt字幕格式,一个是txt纯文本格式,工具会自动把视频里的语言转为中文,并打上时间戳。