#5347 语音识别阶段出错[faster-whisper(本地内置)] 55.mp4没有识别出字幕,请检查是否包含人类说话声音,以及说话语言是否和你选择的原始语言匹配Traceback (most recent call last):File "vi

120.217* Posted at: 2 days ago

语音识别阶段出错[faster-whisper(本地内置)] 55.mp4没有识别出字幕,请检查是否包含人类说话声音,以及说话语言是否和你选择的原始语言匹配
Traceback (most recent call last):

File "videotrans\task\job.py", line 35, in run

File "videotrans\task\job.py", line 100, in process_task

File "videotrans\task\trans_create.py", line 333, in recogn

videotrans.configure.excepts.SpeechToTextError: 55.mp4没有识别出字幕,请检查是否包含人类说话声音,以及说话语言是否和你选择的原始语言匹配
cfg=[TaskCfgVTT]当前工作模式: 转录并翻译字幕
原始输入文件名: E:/5/55.mp4,
输出结果保存到文件夹: E:/5/_video_out/55-mp4,
临时文件夹: D:/Pyvideotran 4.03-0622/tmp/4388/dc99d9ce9a
已选 清理已存在
已选 启用CUDA加速
未选 降噪
语音识别:faster-whisper(本地内置), model_name: large-v3-turbo, 发音语言: 英语, 断句方式:默认断句
翻译渠道:微软(免费),原始语言:英语,目标语言:简体中文, 已选 发送完整字幕
输出字幕格式: 单字幕
代理地址:


=
system:Windows-10-10.0.26200-SP0
version:v4.03
frozen:True
language:zh
root_dir:D:/Pyvideotran 4.03-0622

1 Replies

这是由于视频中可能没有检测到有效的人类语音,或语音音量过低、背景噪音过大,也可能是发音语言选择与视频实际语言不匹配导致的。

解决方案:

  1. 确认视频内容:使用播放器打开视频,确认是否有清晰的人类说话声,且非纯音乐/背景音。
  2. 切换语言设置:若视频实际语言非英语,请在主界面将“发音语言”改为正确选项(如“中文”)。
  3. 尝试其他模型:在语音识别渠道中选择 faster-whisper(本地) 并使用 mediumbase 模型测试,排除 large-v3-turbo 模型下载不完整或兼容性问题。
  4. 检查CUDA状态:暂时取消勾选“CUDA加速”再执行一次,确定是否为显卡环境问题。若取消后成功,需检查CUDA和cuDNN安装是否正确(参考知识库GPU配置部分)。
  5. 增加降噪:在主界面点击“设置更多参数”,勾选“降噪”后重试,可过滤背景噪声。

若以上步骤均无效,请提供软件安装目录下 logs/ 文件夹中最新日志文件的完整内容(复制底部约30行),以便进一步定位。

Post Your Reply
Open source and free maintenance is not easy. If this project is helpful to you, please consider making a small donation to help the project continue to maintain and update. Dondate: ko-fi.com/jianchang512

Related resource