#2749 TaskCfg(cache_folder='D:/Tool/win-pyvideotrans-v3.91/tmp/11616/5840a1f5a1', target_dir='D:/Tool/win-pyvideotrans-v3.91/o

106.4* Posted at: 5 months ago

语音识别阶段出错 [faster-whisper(本地)] 2.1 【机构+电脑端】机构备案登记.mp4没有识别出字幕，请检查是否包含人类说话声音，以及说话语言是否和你选择的原始语言匹配
Traceback (most recent call last):
File "videotrans\task\job.py", line 113, in run
File "videotrans\task\_speech2text.py", line 161, in recogn
RuntimeError: 2.1 【机构+电脑端】机构备案登记.mp4没有识别出字幕，请检查是否包含人类说话声音，以及说话语言是否和你选择的原始语言匹配

TaskCfg(cache_folder='D:/Tool/win-pyvideotrans-v3.91/tmp/11616/5840a1f5a1', target_dir='D:/Tool/win-pyvideotrans-v3.91/output/recogn', remove_noise=False, is_separate=False, detect_language='zh-cn', subtitle_language=None, source_language=None, target_language=None, source_language_code=None, target_language_code=None, source_sub=None, target_sub='D:/Tool/win-pyvideotrans-v3.91/output/recogn/2.1 【机构+电脑端】机构备案登记.srt', source_wav=None, source_wav_output=None, target_wav=None, target_wav_output=None, subtitles=None, novoice_mp4=None, noextname='2.1 【机构+电脑端】机构备案登记', shibie_audio='D:/Tool/win-pyvideotrans-v3.91/tmp/11616/5840a1f5a1/2.1 【机构+电脑端】机构备案登记-1768903629.9444575.wav', targetdir_mp4=None, instrument=None, vocal=None, back_audio=None, background_music=None, app_mode='biaozhun', subtitle_type=0, volume='+0%', pitch='+0Hz', voice_rate='+0%', voice_role=None, copysrt_rawvideo=False, clear_cache=False, translate_type=None, tts_type=None, recogn_type=0, model_name='large-v3-turbo', split_type=0, voice_autorate=False, video_autorate=False, cuda=True, name='D:/Downloads/机构端/2.1 【机构+电脑端】机构备案登记.mp4', basename='2.1 【机构+电脑端】机构备案登记.mp4', ext='mp4', dirname='D:/Downloads/机构端', shound_del_name=None, uuid='5840a1f5a1', remove_silent_mid=False, align_sub_audio=True, enable_diariz=False, nums_diariz=0, rephrase=0, only_out_mp4=False)

=
system:Windows-10-10.0.19044-SP0
version:v3.91
frozen:True
language:zh
root_dir:D:/Tool/win-pyvideotrans-v3.91

Floor #1 DeepSeek reply at 5 months ago

此错误表明语音识别未能从视频中检测到有效的人声。请按以下步骤排查：

检查视频内容：确认视频确实包含清晰的人声说话，而非纯背景音乐或环境噪音。
检查语言设置：在语音识别设置中，发音语言 是否正确选择了视频中说话的语言（例如中文）。如果不确定，可以尝试选择 auto。
检查音频轨道：使用播放器（如 PotPlayer、VLC）打开视频，确认有音频且能正常播放人声。
处理特殊文件名：您的视频文件名包含 【】 等特殊符号，这可能导致处理路径异常。请将视频文件重命名为纯英文或数字（如 2.1_jigou.mp4），并放置在一个简单的路径下（如 D:/tmp.mp4），然后重新尝试。
尝试降噪：在主界面勾选 降噪 选项，这有助于在嘈杂背景中提取人声。
更换识别模型：如果使用的是 tiny 或 small 等小模型，可尝试更换为 medium 或 large-v3 以提高识别能力。

如果以上步骤均无效，请提供 videotrans/logs/ 目录下的最新日志文件以便进一步分析。

#2749 TaskCfg(cache_folder='D:/Tool/win-pyvideotrans-v3.91/tmp/11616/5840a1f5a1', target_dir='D:/Tool/win-pyvideotrans-v3.91/o

1 Replies

请查看更多参考文档:

Post Your Reply

Related resource