原创 Austin 66秒改日科技2023-12-12 19:37 北京sex8.cc
序论:
Whisper是OpenAI 开导的自动语音识别(ASR)系统,具有高鲁棒性和准确性。它接收编码器-解码器结构,基于 Transformer 模子。Whisper 守旧多种话语转录和翻译,并在大限度数据集上展现出优秀的性能。这为语音识别本事的逾越提供了有劲守旧。
了解更多:https://github.com/openai/whisper
Whisper-WebUI抑制:
03:39地址:https://github.com/jhj0517/Whisper-WebUI
图片
装配和驱动:
提供两种装配面孔:
径直用整合包(保举)
下载地址:https://www.123pan.com/s/uSmfjv-eiDCA.html
Git装配
装配Python 3.8 到 3.10
装配FFmpeg
驱动pip install whisper-webui
之后,掀开网页浏览器并考察 http://localhost:7860
省略使用:
图片
选拔要翻译的视频或者音频
诞生V3模子,选拔汉文,字幕纰谬
高等底下无须管,径直驱动。
草榴网查验字幕有莫得问题,需不需要修改。
点击右下角文献夹图标,掀开Whisper-WebUI\outputs输长进径。
补充:
此景色默许集成了faster-whisper,以已毕更好的VRAM使用和转录速率。
笔据faster-whisper的形色,优化后的Whisper模子的遵守如下:
图片
淌若念念使用原始的Open AI Whisper已毕而不是优化的Whisper,不错将大叫行参数诞生为DISABLE_FASTER_WHISPER=True。
可用模子 以下是Whisper的原始VRAM使用表,用于不同大小的模子。
大小 参数 仅英文模子 多话语模子 所需VRAM 相对速率
图片
.en模子仅适用于英文,况兼真理的是,还不错使用“large”模子中的“Translate to English”选项!
纪念:
Whisper-WebUI是一个基于Web的界面,用于简陋使用Whisper模子生成字幕。通过这个界面,不错省略地从各式起首生成字幕、进行语音翻译和文本翻译,而无需潜入了解本事细节。界面守旧多种模子大小,不错在速率、准确性和所需资源方面进行选拔。
完over.
本站仅提供存储办事,统统本体均由用户发布,如发现存害或侵权本体,请点击举报。