sex8.cc WhisperWebUI,视频&音频离线翻译字幕。一键整合!

发布日期:2024-10-03 20:38    点击次数:131

sex8.cc WhisperWebUI,视频&音频离线翻译字幕。一键整合!

原创 Austin 66秒改日科技2023-12-12 19:37 北京sex8.cc

序论:

Whisper是OpenAI 开导的自动语音识别(ASR)系统,具有高鲁棒性和准确性。它接收编码器-解码器结构,基于 Transformer 模子。Whisper 守旧多种话语转录和翻译,并在大限度数据集上展现出优秀的性能。这为语音识别本事的逾越提供了有劲守旧。

了解更多:https://github.com/openai/whisper

Whisper-WebUI抑制:

03:39
地址:https://github.com/jhj0517/Whisper-WebUI

图片

装配和驱动:

提供两种装配面孔:

径直用整合包(保举)

下载地址:https://www.123pan.com/s/uSmfjv-eiDCA.html

Git装配

装配Python 3.8 到 3.10

装配FFmpeg

驱动pip install whisper-webui

之后,掀开网页浏览器并考察 http://localhost:7860

省略使用:

图片

选拔要翻译的视频或者音频

诞生V3模子,选拔汉文,字幕纰谬

高等底下无须管,径直驱动。

草榴网

查验字幕有莫得问题,需不需要修改。

点击右下角文献夹图标,掀开Whisper-WebUI\outputs输长进径。

补充:

此景色默许集成了faster-whisper,以已毕更好的VRAM使用和转录速率。

笔据faster-whisper的形色,优化后的Whisper模子的遵守如下:

图片

淌若念念使用原始的Open AI Whisper已毕而不是优化的Whisper,不错将大叫行参数诞生为DISABLE_FASTER_WHISPER=True。

可用模子 以下是Whisper的原始VRAM使用表,用于不同大小的模子。

大小 参数 仅英文模子 多话语模子 所需VRAM 相对速率 

图片

.en模子仅适用于英文,况兼真理的是,还不错使用“large”模子中的“Translate to English”选项!

纪念:

Whisper-WebUI是一个基于Web的界面,用于简陋使用Whisper模子生成字幕。通过这个界面,不错省略地从各式起首生成字幕、进行语音翻译和文本翻译,而无需潜入了解本事细节。界面守旧多种模子大小,不错在速率、准确性和所需资源方面进行选拔。

完over.

本站仅提供存储办事,统统本体均由用户发布,如发现存害或侵权本体,请点击举报。

栏目分类
热点资讯
相关资讯