#2377 TaskCfg(cache_folder='D:/win-videotrans/tmp/20124/d17ffc3c64', target_dir='D:/U2B+/OF++/_video_out/01. Mercoledì 17-09-2

154.86* Posted at: 4 hours ago 👁8

语音识别阶段出错 [faster-whisper(本地)] 01. Mercoledì 17-09-25 - Live Setup Swing (Andrea Cimitan & Fabervaale).mp4没有识别出字幕,请检查是否包含人类说话声音,以及说话语言是否和你选择的原始语言匹配
Traceback (most recent call last):
File "videotrans\task\job.py", line 113, in run
File "videotrans\task\trans_create.py", line 379, in recogn
RuntimeError: 01. Mercoledì 17-09-25 - Live Setup Swing (Andrea Cimitan & Fabervaale).mp4没有识别出字幕,请检查是否包含人类说话声音,以及说话语言是否和你选择的原始语言匹配

TaskCfg(cache_folder='D:/win-videotrans/tmp/20124/d17ffc3c64', target_dir='D:/U2B+/OF++/_video_out/01. Mercoledì 17-09-25 - Live Setup Swing (Andrea Cimitan & Fabervaale)-mp4', remove_noise=False, is_separate=False, detect_language='it', subtitle_language=None, source_language='意大利语', target_language='简体中文', source_language_code='it', target_language_code='zh-cn', source_sub='D:/U2B+/OF++/_video_out/01. Mercoledì 17-09-25 - Live Setup Swing (Andrea Cimitan & Fabervaale)-mp4/it.srt', target_sub='D:/U2B+/OF++/_video_out/01. Mercoledì 17-09-25 - Live Setup Swing (Andrea Cimitan & Fabervaale)-mp4/zh-cn.srt', source_wav='D:/win-videotrans/tmp/20124/d17ffc3c64/it.wav', source_wav_output='D:/U2B+/OF++/_video_out/01. Mercoledì 17-09-25 - Live Setup Swing (Andrea Cimitan & Fabervaale)-mp4/it.m4a', target_wav='D:/win-videotrans/tmp/20124/d17ffc3c64/target.wav', target_wav_output='D:/U2B+/OF++/_video_out/01. Mercoledì 17-09-25 - Live Setup Swing (Andrea Cimitan & Fabervaale)-mp4/zh-cn.m4a', subtitles='', novoice_mp4='D:/win-videotrans/tmp/20124/d17ffc3c64/novoice.mp4', noextname='01. Mercoledì 17-09-25 - Live Setup Swing (Andrea Cimitan & Fabervaale)', shibie_audio=None, targetdir_mp4='D:/U2B+/OF++/_video_out/01. Mercoledì 17-09-25 - Live Setup Swing (Andrea Cimitan & Fabervaale)-mp4/01. Mercoledì 17-09-25 - Live Setup Swing (Andrea Cimitan & Fabervaale).mp4', instrument=None, vocal=None, back_audio='', background_music=None, app_mode='biaozhun', subtitle_type=0, volume='+0%', pitch='+0Hz', voice_rate='+0%', voice_role='Yunxi(Male/CN)', copysrt_rawvideo=False, clear_cache=False, translate_type=3, tts_type=0, recogn_type=0, model_name='large-v3-turbo', split_type=0, voice_autorate=False, video_autorate=True, cuda=True, name='D:/U2B+/OF++/Morpheus Education - Trincea Global Macro 2025 23v/01. Mercoledì 17-09-25 - Live Setup Swing (Andrea Cimitan & Fabervaale).mp4', basename='01. Mercoledì 17-09-25 - Live Setup Swing (Andrea Cimitan & Fabervaale).mp4', ext='mp4', dirname='D:/U2B+/OF++/Morpheus Education - Trincea Global Macro 2025 23v', shound_del_name=None, uuid='d17ffc3c64', remove_silent_mid=False, align_sub_audio=True, enable_diariz=False, nums_diariz=0, rephrase=0, only_out_mp4=False)


=
system:Windows-10-10.0.26100-SP0
version:v3.92
frozen:True
language:zh
root_dir:D:/win-videotrans

1 Replies

此错误表明语音识别阶段未能从视频中检测到有效的人声。结合您的配置信息(意大利语视频,使用 faster-whisperlarge-v3-turbo 模型),请按以下步骤排查:

  1. 验证视频音频内容:请先使用播放器打开视频,确认其中确实包含清晰的意大利语人声说话内容,而非纯音乐、环境音或极低的背景人声。
  2. 调整语音识别参数

    • 在软件主界面,将 语音识别模型large-v3-turbo 更换为 large-v3large-v2turbo 版本在某些情况下可能不稳定。
    • 在菜单栏选择 工具 -> 高级选项
    • Faster/OpenAI/Whisper 语音识别微调 区域,尝试降低 语音阈值(例如从默认的 0.45 改为 0.3),以提高对微弱人声的灵敏度。
    • 同时,确保 CUDA数据类型 设置为 float16int8(如果显存充足,float32 精度更高)。
  3. 尝试其他识别模式:在主界面 语音识别 区域,将 识别模式整体识别 切换为 批量推理,有时不同的切分方式能更好地捕捉语音。
  4. 检查文件路径:您的视频文件名包含特殊字符 ì 和空格,虽然软件通常能处理,但极端情况下可能影响。可以尝试将视频文件重命名为纯英文短名(如 test.mp4)并放在简单路径(如 D:/test.mp4)下再试。
  5. 使用备用识别渠道:如果以上步骤均无效,可以尝试使用 阿里FunASR(本地) 渠道(对中文支持好)或 OpenAI 在线API(需配置Key)进行识别,以排除本地模型问题。

如果确认视频有人声但上述方法均失败,请提供 D:/win-videotrans/logs/ 目录下的最新日志文件以便进一步分析。

请查看更多参考文档:

Post Your Reply
Open source and free maintenance is not easy. If this project is helpful to you, please consider making a small donation to help the project continue to maintain and update.

Donate: https://ko-fi.com/jianchang512

Trending Questions