#2595 TaskCfg(cache_folder='D:/Download/win-pyvideotrans-v3.92/tmp/23916/aa336b9671', target_dir='D:/Download/win-pyvideotrans

203.175* Posted at: 1 month ago 👁46

语音识别阶段出错 [faster-whisper(本地)] Testing Insane Things You CANT UNSEE in Minecraft.mp4没有识别出字幕,请检查是否包含人类说话声音,以及说话语言是否和你选择的原始语言匹配
Traceback (most recent call last):
File "videotrans\task\job.py", line 113, in run
File "videotrans\task\_speech2text.py", line 161, in recogn
RuntimeError: Testing Insane Things You CANT UNSEE in Minecraft.mp4没有识别出字幕,请检查是否包含人类说话声音,以及说话语言是否和你选择的原始语言匹配

TaskCfg(cache_folder='D:/Download/win-pyvideotrans-v3.92/tmp/23916/aa336b9671', target_dir='D:/Download/win-pyvideotrans-v3.92/output/recogn', remove_noise=False, is_separate=False, detect_language='auto', subtitle_language=None, source_language=None, target_language=None, source_language_code=None, target_language_code=None, source_sub=None, target_sub='D:/Download/win-pyvideotrans-v3.92/output/recogn/Testing Insane Things You CANT UNSEE in Minecraft.srt', source_wav=None, source_wav_output=None, target_wav=None, target_wav_output=None, subtitles=None, novoice_mp4=None, noextname='Testing Insane Things You CANT UNSEE in Minecraft', shibie_audio='D:/Download/win-pyvideotrans-v3.92/tmp/23916/aa336b9671/Testing Insane Things You CANT UNSEE in Minecraft-1768135676.224385.wav', targetdir_mp4=None, instrument=None, vocal=None, back_audio=None, background_music=None, app_mode='biaozhun', subtitle_type=0, volume='+0%', pitch='+0Hz', voice_rate='+0%', voice_role=None, copysrt_rawvideo=False, clear_cache=False, translate_type=None, tts_type=None, recogn_type=0, model_name='large-v3', split_type=0, voice_autorate=False, video_autorate=False, cuda=True, name='D:/视频/Testing Insane Things You CANT UNSEE in Minecraft.mp4', basename='Testing Insane Things You CANT UNSEE in Minecraft.mp4', ext='mp4', dirname='D:/视频', shound_del_name=None, uuid='aa336b9671', remove_silent_mid=False, align_sub_audio=True, enable_diariz=False, nums_diariz=0, rephrase=0, only_out_mp4=False)


=
system:Windows-10-10.0.26200-SP0
version:v3.92
frozen:True
language:zh
root_dir:D:/Download/win-pyvideotrans-v3.92

1 Replies

根据错误信息,faster-whisper 未能从视频中识别出任何字幕。这通常由以下几个原因导致:

  1. 视频本身不含人声:请确认该视频是否包含清晰的、可辨识的人类说话声音。如果视频只有背景音乐、游戏音效或环境噪音,语音识别将无法工作。
  2. 语言选择错误:您选择的“原始语言”可能与视频中的实际语言不匹配。请尝试将“原始语言”设置为 auto(自动检测)。
  3. 音频质量问题:背景噪音过大或人声音量过小,导致语音识别失败。您可以尝试:

    • 在主界面勾选 “降噪” 选项。
    • “工具” -> “高级选项” 中,调整 “VAD参数”,例如将“语音阈值”从默认的 0.45 降低到 0.35 或更低,使其对声音更敏感。
  4. 模型问题:虽然您使用了 large-v3 模型,但可以尝试更换为更小的模型(如 medium)或使用 “阿里FunASR(本地)” 渠道(对中文识别效果更佳)。
  5. 文件路径问题:您的视频文件名较长且包含空格和特殊字符(CANT UNSEE)。虽然软件通常能处理,但为排除干扰,建议:

    • 将视频文件重命名为简短英文(如 test.mp4)。
    • 移动到没有中文和空格的路径(如 D:/test.mp4)再尝试。

解决步骤:

  1. 播放视频,确认有人类说话声。
  2. 在主界面“语音识别”区域,将“原始语言”设为 auto
  3. 勾选“降噪”选项。
  4. 如果问题依旧,请尝试更换语音识别渠道或模型。
  5. 如果以上均无效,请提供 D:/Download/win-pyvideotrans-v3.92/logs/ 目录下的最新日志文件。

请查看更多参考文档:

Post Your Reply
Open source and free maintenance is not easy. If this project is helpful to you, please consider making a small donation to help the project continue to maintain and update.

Related resource