#2806 语音识别阶段出错 [faster-whisper(本地)] 59.mp4没有识别出字幕，请检查是否包含人类说话声音，以及说话语言是否和你选择的原始语言匹配Traceback (most recent call last): File "v

155.117* Posted at: 5 months ago

语音识别阶段出错 [faster-whisper(本地)] 59.mp4没有识别出字幕，请检查是否包含人类说话声音，以及说话语言是否和你选择的原始语言匹配
Traceback (most recent call last):
File "videotrans\task\job.py", line 113, in run
File "videotrans\task\trans_create.py", line 379, in recogn
RuntimeError: 59.mp4没有识别出字幕，请检查是否包含人类说话声音，以及说话语言是否和你选择的原始语言匹配

TaskCfg(cache_folder='E:/BaiduNetdiskDownload/win-pyvideotrans-v3.86/tmp/20920/97987d20bf', target_dir='E:/BaiduNetdiskDownload/A64 从Blender基础知识到3D动画/_video_out/59-mp4', remove_noise=False, is_separate=False, detect_language='ko', subtitle_language=None, source_language='韩语', target_language='简体中文', source_language_code='ko', target_language_code='zh-cn', source_sub='E:/BaiduNetdiskDownload/A64 从Blender基础知识到3D动画/_video_out/59-mp4/ko.srt', target_sub='E:/BaiduNetdiskDownload/A64 从Blender基础知识到3D动画/_video_out/59-mp4/zh-cn.srt', source_wav='E:/BaiduNetdiskDownload/win-pyvideotrans-v3.86/tmp/20920/97987d20bf/ko.wav', source_wav_output='E:/BaiduNetdiskDownload/A64 从Blender基础知识到3D动画/_video_out/59-mp4/ko.m4a', target_wav='E:/BaiduNetdiskDownload/win-pyvideotrans-v3.86/tmp/20920/97987d20bf/target.wav', target_wav_output='E:/BaiduNetdiskDownload/A64 从Blender基础知识到3D动画/_video_out/59-mp4/zh-cn.m4a', subtitles='', novoice_mp4='E:/BaiduNetdiskDownload/win-pyvideotrans-v3.86/tmp/20920/97987d20bf/novoice.mp4', noextname='59', shibie_audio=None, targetdir_mp4='E:/BaiduNetdiskDownload/A64 从Blender基础知识到3D动画/_video_out/59-mp4/59.mp4', instrument=None, vocal=None, back_audio='', background_music=None, app_mode='biaozhun', subtitle_type=1, volume='+0%', pitch='+0Hz', voice_rate='+0%', voice_role='Xiaoxiao(Female/CN)', copysrt_rawvideo=False, clear_cache=False, translate_type=4, tts_type=0, recogn_type=0, model_name='large-v3', split_type=0, voice_autorate=True, video_autorate=False, cuda=False, name='E:/BaiduNetdiskDownload/A64 从Blender基础知识到3D动画/59.mp4', basename='59.mp4', ext='mp4', dirname='E:/BaiduNetdiskDownload/A64 从Blender基础知识到3D动画', shound_del_name=None, uuid='97987d20bf', remove_silent_mid=False, align_sub_audio=True, enable_diariz=False, nums_diariz=0, rephrase=1, only_out_mp4=True)

Floor #1 DeepSeek reply at 5 months ago

该错误表明 faster-whisper 在语音识别阶段未能从视频 59.mp4 中检测到任何人类语音。根据您提供的配置（source_language='韩语'），请按以下步骤排查：

确认视频内容：首先，请手动播放 59.mp4，确认视频中确实包含清晰可辨的韩语人声。如果视频本身无声、背景音乐/噪音过大掩盖了人声，或主要内容是纯音乐/环境音，则无法识别。
检查语言设置：您已正确设置原始语言为“韩语”。如果视频中的人声是其他语言（例如日语、英语或方言），请将原始语言改为对应的语言或选择“自动检测”。
尝试“自动检测”语言：在语音识别设置中，将“发音语言”从“韩语”改为“自动检测 (auto)”。这能让模型自动判断语言，避免因语言不匹配导致识别失败。
调整识别参数（如果声音微弱或嘈杂）：
- 在菜单栏选择 工具 -> 高级选项。
- 在“Faster/OpenAI/Whisper 语音识别微调”区域，尝试降低 语音阈值（例如从默认的 0.45 改为 0.3），这会使识别更灵敏，但也可能将更多噪音识别为语音。
- 如果视频中人声间隔较长，可以适当增加 静音分割持续毫秒（例如从 140 改为 300），避免将长段静音误判为语音片段。
更换识别模型或模式：
- 如果当前使用的是 tiny 或 small 等小模型，可以尝试更换为 medium 或 large-v3（您已使用）以获得更好的识别能力。
- 将“识别模式”从“整体识别”切换为“批量推理”，有时能处理一些特殊音频。
检查音频轨道：使用其他播放器或音频编辑软件打开视频，确认其音频轨道正常且包含人声波形。

如果以上步骤均无效，请提供 videotrans/logs/ 目录下最新的日志文件，以便进一步分析。

请查看更多参考文档：

Floor #2 2a09:bac1* reply at 3 months ago

尝试“自动检测”语言在那里设置，3.98版本无自动检测 (auto)这栏

Floor #3 DeepSeek reply at 3 months ago

在 v3.98 版本的“翻译视频或音频”主界面中，已移除了“自动检测 (auto)”选项。您需要在“发音语言”下拉列表中明确指定视频中人声的实际语言（如“韩语”）。

如果您不确定视频的语言，或者仅想进行语音转字幕，请使用软件左侧功能面板中的“批量语音转字幕”功能，该功能面板的“发音语言”选项中包含“自动检测”。

请查阅相关文档：

语音识别渠道说明与介绍

#2806 语音识别阶段出错 [faster-whisper(本地)] 59.mp4没有识别出字幕，请检查是否包含人类说话声音，以及说话语言是否和你选择的原始语言匹配Traceback (most recent call last): File "v

3 Replies

请查看更多参考文档：

请查阅相关文档：

Post Your Reply

Related resource