#2377 TaskCfg(cache_folder='D:/win-videotrans/tmp/20124/d17ffc3c64', target_dir='D:/U2B+/OF++/_video_out/01. Mercoledì 17-09-2

154.86* Posted at: 6 months ago

语音识别阶段出错 [faster-whisper(本地)] 01. Mercoledì 17-09-25 - Live Setup Swing (Andrea Cimitan & Fabervaale).mp4没有识别出字幕，请检查是否包含人类说话声音，以及说话语言是否和你选择的原始语言匹配
Traceback (most recent call last):
File "videotrans\task\job.py", line 113, in run
File "videotrans\task\trans_create.py", line 379, in recogn
RuntimeError: 01. Mercoledì 17-09-25 - Live Setup Swing (Andrea Cimitan & Fabervaale).mp4没有识别出字幕，请检查是否包含人类说话声音，以及说话语言是否和你选择的原始语言匹配

TaskCfg(cache_folder='D:/win-videotrans/tmp/20124/d17ffc3c64', target_dir='D:/U2B+/OF++/_video_out/01. Mercoledì 17-09-25 - Live Setup Swing (Andrea Cimitan & Fabervaale)-mp4', remove_noise=False, is_separate=False, detect_language='it', subtitle_language=None, source_language='意大利语', target_language='简体中文', source_language_code='it', target_language_code='zh-cn', source_sub='D:/U2B+/OF++/_video_out/01. Mercoledì 17-09-25 - Live Setup Swing (Andrea Cimitan & Fabervaale)-mp4/it.srt', target_sub='D:/U2B+/OF++/_video_out/01. Mercoledì 17-09-25 - Live Setup Swing (Andrea Cimitan & Fabervaale)-mp4/zh-cn.srt', source_wav='D:/win-videotrans/tmp/20124/d17ffc3c64/it.wav', source_wav_output='D:/U2B+/OF++/_video_out/01. Mercoledì 17-09-25 - Live Setup Swing (Andrea Cimitan & Fabervaale)-mp4/it.m4a', target_wav='D:/win-videotrans/tmp/20124/d17ffc3c64/target.wav', target_wav_output='D:/U2B+/OF++/_video_out/01. Mercoledì 17-09-25 - Live Setup Swing (Andrea Cimitan & Fabervaale)-mp4/zh-cn.m4a', subtitles='', novoice_mp4='D:/win-videotrans/tmp/20124/d17ffc3c64/novoice.mp4', noextname='01. Mercoledì 17-09-25 - Live Setup Swing (Andrea Cimitan & Fabervaale)', shibie_audio=None, targetdir_mp4='D:/U2B+/OF++/_video_out/01. Mercoledì 17-09-25 - Live Setup Swing (Andrea Cimitan & Fabervaale)-mp4/01. Mercoledì 17-09-25 - Live Setup Swing (Andrea Cimitan & Fabervaale).mp4', instrument=None, vocal=None, back_audio='', background_music=None, app_mode='biaozhun', subtitle_type=0, volume='+0%', pitch='+0Hz', voice_rate='+0%', voice_role='Yunxi(Male/CN)', copysrt_rawvideo=False, clear_cache=False, translate_type=3, tts_type=0, recogn_type=0, model_name='large-v3-turbo', split_type=0, voice_autorate=False, video_autorate=True, cuda=True, name='D:/U2B+/OF++/Morpheus Education - Trincea Global Macro 2025 23v/01. Mercoledì 17-09-25 - Live Setup Swing (Andrea Cimitan & Fabervaale).mp4', basename='01. Mercoledì 17-09-25 - Live Setup Swing (Andrea Cimitan & Fabervaale).mp4', ext='mp4', dirname='D:/U2B+/OF++/Morpheus Education - Trincea Global Macro 2025 23v', shound_del_name=None, uuid='d17ffc3c64', remove_silent_mid=False, align_sub_audio=True, enable_diariz=False, nums_diariz=0, rephrase=0, only_out_mp4=False)

=
system:Windows-10-10.0.26100-SP0
version:v3.92
frozen:True
language:zh
root_dir:D:/win-videotrans

Floor #1 DeepSeek reply at 6 months ago

此错误表明语音识别阶段未能从视频中检测到有效的人声。结合您的配置信息（意大利语视频，使用 faster-whisper 的 large-v3-turbo 模型），请按以下步骤排查：

验证视频音频内容：请先使用播放器打开视频，确认其中确实包含清晰的意大利语人声说话内容，而非纯音乐、环境音或极低的背景人声。
调整语音识别参数：
- 在软件主界面，将 语音识别 的模型从 large-v3-turbo 更换为 large-v3 或 large-v2。turbo 版本在某些情况下可能不稳定。
- 在菜单栏选择 工具 -> 高级选项。
- 在 Faster/OpenAI/Whisper 语音识别微调 区域，尝试降低 语音阈值（例如从默认的 0.45 改为 0.3），以提高对微弱人声的灵敏度。
- 同时，确保 CUDA数据类型 设置为 float16 或 int8（如果显存充足，float32 精度更高）。
尝试其他识别模式：在主界面 语音识别 区域，将 识别模式 从 整体识别 切换为 批量推理，有时不同的切分方式能更好地捕捉语音。
检查文件路径：您的视频文件名包含特殊字符 ì 和空格，虽然软件通常能处理，但极端情况下可能影响。可以尝试将视频文件重命名为纯英文短名（如 test.mp4）并放在简单路径（如 D:/test.mp4）下再试。
使用备用识别渠道：如果以上步骤均无效，可以尝试使用 阿里FunASR(本地) 渠道（对中文支持好）或 OpenAI 在线API（需配置Key）进行识别，以排除本地模型问题。

如果确认视频有人声但上述方法均失败，请提供 D:/win-videotrans/logs/ 目录下的最新日志文件以便进一步分析。

#2377 TaskCfg(cache_folder='D:/win-videotrans/tmp/20124/d17ffc3c64', target_dir='D:/U2B+/OF++/_video_out/01. Mercoledì 17-09-2

1 Replies

请查看更多参考文档:

Post Your Reply

Related resource