#1941 TaskCfg(cache_folder='I:/win-videotrans-v3.78-0821/tmp/3904/speech2text', target_dir='r:/tmp/videotrans/recogn', remove_

101.205* Posted at: 20 days ago 👁41

语音识别阶段出错:[faster-whisper(本地)] 运行时错误:39 - Setup Random Sword Attack Animation.mp4没有识别出字幕,请检查是否包含人类说话声音,以及说话语言是否和你选择的原始语言匹配:
Traceback (most recent call last):
File "videotrans\task\job.py", line 113, in run
File "videotrans\task\_speech2text.py", line 161, in recogn
RuntimeError: 39 - Setup Random Sword Attack Animation.mp4没有识别出字幕,请检查是否包含人类说话声音,以及说话语言是否和你选择的原始语言匹配

TaskCfg(cache_folder='I:/win-videotrans-v3.78-0821/tmp/3904/speech2text', target_dir='r:/tmp/videotrans/recogn', remove_noise=True, is_separate=False, detect_language='en', subtitle_language=None, source_language=None, target_language=None, source_language_code=None, target_language_code=None, source_sub=None, target_sub='r:/tmp/videotrans/recogn/39 - Setup Random Sword Attack Animation.srt', source_wav=None, source_wav_output=None, target_wav=None, target_wav_output=None, subtitles=None, novoice_mp4=None, noextname='39 - Setup Random Sword Attack Animation', shibie_audio='I:/win-videotrans-v3.78-0821/tmp/3904/speech2text/removed_noise_1765422164.6218588.wav', targetdir_mp4=None, instrument=None, vocal=None, back_audio=None, background_music=None, app_mode='biaozhun', subtitle_type=0, volume='+0%', pitch='+0Hz', voice_rate='+0%', voice_role=None, copysrt_rawvideo=False, clear_cache=False, translate_type=None, tts_type=None, recogn_type=0, model_name='large-v3-turbo', split_type=0, voice_autorate=False, video_autorate=False, cuda=True, name='N:/b站上传/充电/新建文件夹/39 - Setup Random Sword Attack Animation.mp4', basename='39 - Setup Random Sword Attack Animation.mp4', ext='mp4', dirname='N:/b站上传/充电/新建文件夹', shound_del_name=None, uuid='63f3deb74c', remove_silent_mid=False, align_sub_audio=True, enable_diariz=True, nums_diariz=0, rephrase=2, only_out_mp4=False)


=
system:Windows-10-10.0.19044-SP0
version:v3.89
frozen:True
language:zh
root_dir:I:/win-videotrans-v3.78-0821

1 Replies

根据错误信息,语音识别阶段未能从视频中检测到有效的人声。这通常由以下几个原因导致,请按顺序排查:

  1. 检查视频内容:确认视频 Setup Random Sword Attack Animation.mp4 中确实包含人类说话声,而非纯背景音乐、音效或无声动画。
  2. 检查语言设置:在软件主界面第3行“翻译设置”中,确保“发音语言”选择了正确的原始语言(例如英语视频选 en)。如果不确定,可以尝试选择 auto 让软件自动检测。
  3. 调整VAD参数(提高识别灵敏度)

    • 点击菜单栏 工具 -> 高级选项
    • 在“Faster/OpenAI/Whisper 语音识别微调”区域,找到“VAD 参数”。
    • 将“语音阈值”从默认的 0.45 调低(例如 0.30.2),这会使识别更灵敏,更容易捕捉到人声。
    • 将“静音分割持续毫秒”适当调高(例如 300),避免将过短的静音误判为句子结束。
  4. 尝试不同的识别模式:在主界面第2行“语音识别”区域,将“识别模式”从“整体识别”切换为“批量推理”,有时后者对某些音频的适应性更好。
  5. 检查音频轨道:使用其他播放器(如 PotPlayer、VLC)播放该视频,确认音频能正常播放且人声清晰。
  6. 文件路径问题:虽然您的文件路径包含中文,但软件已成功读取。作为最后手段,可以尝试将视频文件复制到一个纯英文的短路径下(例如 D:/test.mp4)再进行处理。

如果以上步骤均无效,请提供 I:/win-videotrans-v3.78-0821/logs/ 目录下的最新日志文件,以便进行更深入的分析。

Post Your Reply
Open source and free maintenance is not easy. If this project is helpful to you, please consider making a small donation to help the project continue to maintain and update.

Donate: https://ko-fi.com/jianchang512

Trending Questions