#3459 TaskCfgVTT(is_cuda=True, uuid='a40554519c', cache_folder='H:/win-pyvideotrans-v3.97-0303/tmp/33940/a40554519c', target_d

114.246* Posted at: 22 hours ago 👁20

批处理经常部分文件报错

语音识别阶段出错 [Qwen-ASR(本地)] 文件不存在:13-mp4/zh-cn.srt
Traceback (most recent call last):
File "videotrans\task\job.py", line 105, in run
File "videotrans\task\trans_create.py", line 368, in recogn
File "videotrans\task\_base.py", line 107, in _save_srt_target
FileNotFoundError: [Errno 2] No such file or directory: '13-mp4/zh-cn.srt'
TaskCfgVTT(is_cuda=True, uuid='a40554519c', cache_folder='H:/win-pyvideotrans-v3.97-0303/tmp/33940/a40554519c', target_dir='13-mp4', source_language='简体中文', source_language_code='zh-cn', source_sub='13-mp4/zh-cn.srt', source_wav='H:/win-pyvideotrans-v3.97-0303/tmp/33940/a40554519c/zh-cn.wav', source_wav_output='13-mp4/zh-cn.m4a', target_language='英语', target_language_code='en', target_sub='13-mp4/en.srt', target_wav='H:/win-pyvideotrans-v3.97-0303/tmp/33940/a40554519c/target.wav', target_wav_output='13-mp4/en.m4a', name='H:/醉酒舞剑斩妖魔(60集)吕岳&李梦媛/13.mp4', noextname='13', basename='13.mp4', ext='mp4', dirname='H:/醉酒舞剑斩妖魔(60集)吕岳&李梦媛', shound_del_name=None, translate_type=3, tts_type=0, volume='+0%', pitch='+0Hz', voice_rate='+0%', voice_role='No', voice_autorate=False, video_autorate=False, remove_silent_mid=False, align_sub_audio=True, detect_language='zh-cn', recogn_type=2, model_name='1.7B', shibie_audio=None, remove_noise=False, enable_diariz=False, nums_diariz=0, rephrase=0, fix_punc=False, subtitle_language=None, app_mode='biaozhun', subtitles='', targetdir_mp4='13-mp4/13.mp4', novoice_mp4='H:/win-pyvideotrans-v3.97-0303/tmp/33940/a40554519c/novoice.mp4', is_separate=False, instrument=None, vocal=None, back_audio='', clear_cache=False, background_music=None, subtitle_type=3, only_out_mp4=False, recogn2pass=True, output_srt=2, copysrt_rawvideo=False)


=
system:Windows-10-10.0.26200-SP0
version:v3.97
frozen:True
language:zh
root_dir:H:/win-pyvideotrans-v3.97-0303

4 Replies

这是由于 Qwen-ASR(本地) 语音识别阶段未能成功生成源语言字幕文件 zh-cn.srt,导致后续步骤因文件缺失而报错。

解决方案:

  1. 检查 Qwen-ASR(本地) 模型:确保 Qwen-ASR 模型已正确下载并放置在 models/ 目录下。如果模型下载不完整或损坏,会导致识别失败。
  2. 检查视频文件:确认源视频文件 13.mp4 本身是否损坏,或音频轨道是否存在问题。可以尝试用其他播放器播放,或使用软件的“批量从视频中分离出音频”工具测试是否能正常提取音频。
  3. 调整语音识别参数:在“菜单-工具-高级选项-语音识别参数”中,尝试调整以下设置:

    • 降低 语音阈值 (例如设为 0.3),提高语音检测灵敏度。
    • 确保 最长语音持续秒数 设置合理(例如 10)。
    • 尝试开启 降噪 选项(如果视频背景音复杂)。
    • 如果视频语音不清晰,可以尝试降低 no speech threshold 的值。
  4. 更换语音识别渠道:如果问题持续,可以暂时更换为其他语音识别渠道进行测试,例如 faster-whisper(本地)Edge-TTS(如果视频语言是中文,可尝试 豆包语音识别大模型阿里百炼ASR 等在线渠道),以判断是否为 Qwen-ASR 模型本身的问题。
  5. 查看详细日志:打开软件根目录下的 logs 文件夹,找到以当前日期命名的日志文件(如 2025-03-03.log),搜索 13.mp4a40554519c 相关的更早的报错信息,可能包含 Qwen-ASR 识别失败的具体原因。

请查阅相关文档:

image

这是由于 Qwen-ASR(本地) 语音识别渠道未能成功生成源语言字幕文件 zh-cn.srt,导致后续步骤因文件缺失而报错。从截图看,任务在“语音识别”阶段失败。

解决方案:

  1. 检查 Qwen-ASR 模型:确保 Qwen-ASR 模型已正确下载并放置在 models/ 目录下。如果模型下载不完整或损坏,会导致识别失败。你可以尝试手动下载模型文件。
  2. 检查视频文件:确认源视频文件 13.mp4 本身是否损坏,或音频轨道是否存在问题。可以尝试用其他播放器播放,或使用软件的“批量从视频中分离出音频”工具测试是否能正常提取音频。
  3. 调整语音识别参数:在“菜单-工具-高级选项-语音识别参数”中,尝试调整以下设置:

    • 降低 语音阈值 (例如设为 0.3),提高语音检测灵敏度。
    • 确保 最长语音持续秒数 设置合理(例如 10)。
    • 尝试开启 降噪 选项(如果视频背景音复杂)。
    • 如果视频语音不清晰,可以尝试降低 no speech threshold 的值。
  4. 更换语音识别渠道:如果问题持续,可以暂时更换为其他语音识别渠道进行测试,例如 faster-whisper(本地)Edge-TTS(如果视频语言是中文,可尝试 豆包语音识别大模型阿里百炼ASR 等在线渠道),以判断是否为 Qwen-ASR 模型本身的问题。
  5. 查看详细日志:打开软件根目录下的 logs 文件夹,找到以当前日期命名的日志文件(如 2025-03-03.log),搜索 13.mp4a40554519c 相关的更早的报错信息,可能包含 Qwen-ASR 识别失败的具体原因。

请查阅相关文档:

是在同一块硬盘吗?是本地路径还是\\\\这类网络路径?有没有手动点击“输出...”按钮设置?看起来 target_dir 不太正常,应该是 盘符:/开头才对

点击 菜单-工具-高级选项-通用设置-批量翻译时强制串行,选中它,然后保存,再批量试试还有米有报错

Post Your Reply
Open source and free maintenance is not easy. If this project is helpful to you, please consider making a small donation to help the project continue to maintain and update.

Related resource