#2749 TaskCfg(cache_folder='D:/Tool/win-pyvideotrans-v3.91/tmp/11616/5840a1f5a1', target_dir='D:/Tool/win-pyvideotrans-v3.91/o

106.4* Posted at: 7 days ago 👁24

语音识别阶段出错 [faster-whisper(本地)] 2.1 【机构+电脑端】机构备案登记.mp4没有识别出字幕,请检查是否包含人类说话声音,以及说话语言是否和你选择的原始语言匹配
Traceback (most recent call last):
File "videotrans\task\job.py", line 113, in run
File "videotrans\task\_speech2text.py", line 161, in recogn
RuntimeError: 2.1 【机构+电脑端】机构备案登记.mp4没有识别出字幕,请检查是否包含人类说话声音,以及说话语言是否和你选择的原始语言匹配

TaskCfg(cache_folder='D:/Tool/win-pyvideotrans-v3.91/tmp/11616/5840a1f5a1', target_dir='D:/Tool/win-pyvideotrans-v3.91/output/recogn', remove_noise=False, is_separate=False, detect_language='zh-cn', subtitle_language=None, source_language=None, target_language=None, source_language_code=None, target_language_code=None, source_sub=None, target_sub='D:/Tool/win-pyvideotrans-v3.91/output/recogn/2.1 【机构+电脑端】机构备案登记.srt', source_wav=None, source_wav_output=None, target_wav=None, target_wav_output=None, subtitles=None, novoice_mp4=None, noextname='2.1 【机构+电脑端】机构备案登记', shibie_audio='D:/Tool/win-pyvideotrans-v3.91/tmp/11616/5840a1f5a1/2.1 【机构+电脑端】机构备案登记-1768903629.9444575.wav', targetdir_mp4=None, instrument=None, vocal=None, back_audio=None, background_music=None, app_mode='biaozhun', subtitle_type=0, volume='+0%', pitch='+0Hz', voice_rate='+0%', voice_role=None, copysrt_rawvideo=False, clear_cache=False, translate_type=None, tts_type=None, recogn_type=0, model_name='large-v3-turbo', split_type=0, voice_autorate=False, video_autorate=False, cuda=True, name='D:/Downloads/机构端/2.1 【机构+电脑端】机构备案登记.mp4', basename='2.1 【机构+电脑端】机构备案登记.mp4', ext='mp4', dirname='D:/Downloads/机构端', shound_del_name=None, uuid='5840a1f5a1', remove_silent_mid=False, align_sub_audio=True, enable_diariz=False, nums_diariz=0, rephrase=0, only_out_mp4=False)


=
system:Windows-10-10.0.19044-SP0
version:v3.91
frozen:True
language:zh
root_dir:D:/Tool/win-pyvideotrans-v3.91

1 Replies

此错误表明语音识别未能从视频中检测到有效的人声。请按以下步骤排查:

  1. 检查视频内容:确认视频确实包含清晰的人声说话,而非纯背景音乐或环境噪音。
  2. 检查语言设置:在语音识别设置中,发音语言 是否正确选择了视频中说话的语言(例如中文)。如果不确定,可以尝试选择 auto
  3. 检查音频轨道:使用播放器(如 PotPlayer、VLC)打开视频,确认有音频且能正常播放人声。
  4. 处理特殊文件名:您的视频文件名包含 【】 等特殊符号,这可能导致处理路径异常。请将视频文件重命名为纯英文或数字(如 2.1_jigou.mp4),并放置在一个简单的路径下(如 D:/tmp.mp4),然后重新尝试。
  5. 尝试降噪:在主界面勾选 降噪 选项,这有助于在嘈杂背景中提取人声。
  6. 更换识别模型:如果使用的是 tinysmall 等小模型,可尝试更换为 mediumlarge-v3 以提高识别能力。

如果以上步骤均无效,请提供 videotrans/logs/ 目录下的最新日志文件以便进一步分析。

请查看更多参考文档:

Post Your Reply
Open source and free maintenance is not easy. If this project is helpful to you, please consider making a small donation to help the project continue to maintain and update.

Related resource