#2806 语音识别阶段出错 [faster-whisper(本地)] 59.mp4没有识别出字幕,请检查是否包含人类说话声音,以及说话语言是否和你选择的原始语言匹配Traceback (most recent call last): File "v

155.117* Posted at: 5 days ago 👁24

语音识别阶段出错 [faster-whisper(本地)] 59.mp4没有识别出字幕,请检查是否包含人类说话声音,以及说话语言是否和你选择的原始语言匹配
Traceback (most recent call last):
File "videotrans\task\job.py", line 113, in run
File "videotrans\task\trans_create.py", line 379, in recogn
RuntimeError: 59.mp4没有识别出字幕,请检查是否包含人类说话声音,以及说话语言是否和你选择的原始语言匹配

TaskCfg(cache_folder='E:/BaiduNetdiskDownload/win-pyvideotrans-v3.86/tmp/20920/97987d20bf', target_dir='E:/BaiduNetdiskDownload/A64 从Blender基础知识到3D动画/_video_out/59-mp4', remove_noise=False, is_separate=False, detect_language='ko', subtitle_language=None, source_language='韩语', target_language='简体中文', source_language_code='ko', target_language_code='zh-cn', source_sub='E:/BaiduNetdiskDownload/A64 从Blender基础知识到3D动画/_video_out/59-mp4/ko.srt', target_sub='E:/BaiduNetdiskDownload/A64 从Blender基础知识到3D动画/_video_out/59-mp4/zh-cn.srt', source_wav='E:/BaiduNetdiskDownload/win-pyvideotrans-v3.86/tmp/20920/97987d20bf/ko.wav', source_wav_output='E:/BaiduNetdiskDownload/A64 从Blender基础知识到3D动画/_video_out/59-mp4/ko.m4a', target_wav='E:/BaiduNetdiskDownload/win-pyvideotrans-v3.86/tmp/20920/97987d20bf/target.wav', target_wav_output='E:/BaiduNetdiskDownload/A64 从Blender基础知识到3D动画/_video_out/59-mp4/zh-cn.m4a', subtitles='', novoice_mp4='E:/BaiduNetdiskDownload/win-pyvideotrans-v3.86/tmp/20920/97987d20bf/novoice.mp4', noextname='59', shibie_audio=None, targetdir_mp4='E:/BaiduNetdiskDownload/A64 从Blender基础知识到3D动画/_video_out/59-mp4/59.mp4', instrument=None, vocal=None, back_audio='', background_music=None, app_mode='biaozhun', subtitle_type=1, volume='+0%', pitch='+0Hz', voice_rate='+0%', voice_role='Xiaoxiao(Female/CN)', copysrt_rawvideo=False, clear_cache=False, translate_type=4, tts_type=0, recogn_type=0, model_name='large-v3', split_type=0, voice_autorate=True, video_autorate=False, cuda=False, name='E:/BaiduNetdiskDownload/A64 从Blender基础知识到3D动画/59.mp4', basename='59.mp4', ext='mp4', dirname='E:/BaiduNetdiskDownload/A64 从Blender基础知识到3D动画', shound_del_name=None, uuid='97987d20bf', remove_silent_mid=False, align_sub_audio=True, enable_diariz=False, nums_diariz=0, rephrase=1, only_out_mp4=True)

1 Replies

该错误表明 faster-whisper 在语音识别阶段未能从视频 59.mp4 中检测到任何人类语音。根据您提供的配置(source_language='韩语'),请按以下步骤排查:

  1. 确认视频内容:首先,请手动播放 59.mp4,确认视频中确实包含清晰可辨的韩语人声。如果视频本身无声、背景音乐/噪音过大掩盖了人声,或主要内容是纯音乐/环境音,则无法识别。
  2. 检查语言设置:您已正确设置原始语言为“韩语”。如果视频中的人声是其他语言(例如日语、英语或方言),请将原始语言改为对应的语言或选择“自动检测”。
  3. 尝试“自动检测”语言:在语音识别设置中,将“发音语言”从“韩语”改为“自动检测 (auto)”。这能让模型自动判断语言,避免因语言不匹配导致识别失败。
  4. 调整识别参数(如果声音微弱或嘈杂)

    • 在菜单栏选择 工具 -> 高级选项
    • 在“Faster/OpenAI/Whisper 语音识别微调”区域,尝试降低 语音阈值(例如从默认的 0.45 改为 0.3),这会使识别更灵敏,但也可能将更多噪音识别为语音。
    • 如果视频中人声间隔较长,可以适当增加 静音分割持续毫秒(例如从 140 改为 300),避免将长段静音误判为语音片段。
  5. 更换识别模型或模式

    • 如果当前使用的是 tinysmall 等小模型,可以尝试更换为 mediumlarge-v3(您已使用)以获得更好的识别能力。
    • 将“识别模式”从“整体识别”切换为“批量推理”,有时能处理一些特殊音频。
  6. 检查音频轨道:使用其他播放器或音频编辑软件打开视频,确认其音频轨道正常且包含人声波形。

如果以上步骤均无效,请提供 videotrans/logs/ 目录下最新的日志文件,以便进一步分析。

请查看更多参考文档:

Post Your Reply
Open source and free maintenance is not easy. If this project is helpful to you, please consider making a small donation to help the project continue to maintain and update.

Related resource