#3459 TaskCfgVTT(is_cuda=True, uuid='a40554519c', cache_folder='H:/win-pyvideotrans-v3.97-0303/tmp/33940/a40554519c', target_d

114.246* Posted at: 4 months ago

批处理经常部分文件报错

语音识别阶段出错 [Qwen-ASR(本地)] 文件不存在：13-mp4/zh-cn.srt
Traceback (most recent call last):
File "videotrans\task\job.py", line 105, in run
File "videotrans\task\trans_create.py", line 368, in recogn
File "videotrans\task\_base.py", line 107, in _save_srt_target
FileNotFoundError: [Errno 2] No such file or directory: '13-mp4/zh-cn.srt'
TaskCfgVTT(is_cuda=True, uuid='a40554519c', cache_folder='H:/win-pyvideotrans-v3.97-0303/tmp/33940/a40554519c', target_dir='13-mp4', source_language='简体中文', source_language_code='zh-cn', source_sub='13-mp4/zh-cn.srt', source_wav='H:/win-pyvideotrans-v3.97-0303/tmp/33940/a40554519c/zh-cn.wav', source_wav_output='13-mp4/zh-cn.m4a', target_language='英语', target_language_code='en', target_sub='13-mp4/en.srt', target_wav='H:/win-pyvideotrans-v3.97-0303/tmp/33940/a40554519c/target.wav', target_wav_output='13-mp4/en.m4a', name='H:/醉酒舞剑斩妖魔（60集）吕岳&李梦媛/13.mp4', noextname='13', basename='13.mp4', ext='mp4', dirname='H:/醉酒舞剑斩妖魔（60集）吕岳&李梦媛', shound_del_name=None, translate_type=3, tts_type=0, volume='+0%', pitch='+0Hz', voice_rate='+0%', voice_role='No', voice_autorate=False, video_autorate=False, remove_silent_mid=False, align_sub_audio=True, detect_language='zh-cn', recogn_type=2, model_name='1.7B', shibie_audio=None, remove_noise=False, enable_diariz=False, nums_diariz=0, rephrase=0, fix_punc=False, subtitle_language=None, app_mode='biaozhun', subtitles='', targetdir_mp4='13-mp4/13.mp4', novoice_mp4='H:/win-pyvideotrans-v3.97-0303/tmp/33940/a40554519c/novoice.mp4', is_separate=False, instrument=None, vocal=None, back_audio='', clear_cache=False, background_music=None, subtitle_type=3, only_out_mp4=False, recogn2pass=True, output_srt=2, copysrt_rawvideo=False)

=
system:Windows-10-10.0.26200-SP0
version:v3.97
frozen:True
language:zh
root_dir:H:/win-pyvideotrans-v3.97-0303

Floor #1 DeepSeek reply at 4 months ago

这是由于 Qwen-ASR(本地) 语音识别阶段未能成功生成源语言字幕文件 zh-cn.srt，导致后续步骤因文件缺失而报错。

解决方案：

检查 Qwen-ASR(本地) 模型：确保 Qwen-ASR 模型已正确下载并放置在 models/ 目录下。如果模型下载不完整或损坏，会导致识别失败。
检查视频文件：确认源视频文件 13.mp4 本身是否损坏，或音频轨道是否存在问题。可以尝试用其他播放器播放，或使用软件的“批量从视频中分离出音频”工具测试是否能正常提取音频。
调整语音识别参数：在“菜单-工具-高级选项-语音识别参数”中，尝试调整以下设置：
- 降低 语音阈值 (例如设为 0.3)，提高语音检测灵敏度。
- 确保 最长语音持续秒数 设置合理（例如 10）。
- 尝试开启 降噪 选项（如果视频背景音复杂）。
- 如果视频语音不清晰，可以尝试降低 no speech threshold 的值。
更换语音识别渠道：如果问题持续，可以暂时更换为其他语音识别渠道进行测试，例如 faster-whisper(本地) 或 Edge-TTS（如果视频语言是中文，可尝试 豆包语音识别大模型 或 阿里百炼ASR 等在线渠道），以判断是否为 Qwen-ASR 模型本身的问题。
查看详细日志：打开软件根目录下的 logs 文件夹，找到以当前日期命名的日志文件（如 2025-03-03.log），搜索 13.mp4 或 a40554519c 相关的更早的报错信息，可能包含 Qwen-ASR 识别失败的具体原因。

请查阅相关文档：

Floor #2 114.246* reply at 4 months ago

Floor #3 DeepSeek reply at 4 months ago

这是由于 Qwen-ASR(本地) 语音识别渠道未能成功生成源语言字幕文件 zh-cn.srt，导致后续步骤因文件缺失而报错。从截图看，任务在“语音识别”阶段失败。

解决方案：

检查 Qwen-ASR 模型：确保 Qwen-ASR 模型已正确下载并放置在 models/ 目录下。如果模型下载不完整或损坏，会导致识别失败。你可以尝试手动下载模型文件。
检查视频文件：确认源视频文件 13.mp4 本身是否损坏，或音频轨道是否存在问题。可以尝试用其他播放器播放，或使用软件的“批量从视频中分离出音频”工具测试是否能正常提取音频。
调整语音识别参数：在“菜单-工具-高级选项-语音识别参数”中，尝试调整以下设置：
- 降低 语音阈值 (例如设为 0.3)，提高语音检测灵敏度。
- 确保 最长语音持续秒数 设置合理（例如 10）。
- 尝试开启降噪选项（如果视频背景音复杂）。
- 如果视频语音不清晰，可以尝试降低 no speech threshold 的值。
更换语音识别渠道：如果问题持续，可以暂时更换为其他语音识别渠道进行测试，例如 faster-whisper(本地) 或 Edge-TTS（如果视频语言是中文，可尝试 豆包语音识别大模型 或 阿里百炼ASR 等在线渠道），以判断是否为 Qwen-ASR 模型本身的问题。
查看详细日志：打开软件根目录下的 logs 文件夹，找到以当前日期命名的日志文件（如 2025-03-03.log），搜索 13.mp4 或 a40554519c 相关的更早的报错信息，可能包含 Qwen-ASR 识别失败的具体原因。

请查阅相关文档：

Floor #4 Admin reply at 4 months ago

是在同一块硬盘吗？是本地路径还是\\\\这类网络路径？有没有手动点击“输出...”按钮设置？看起来 target_dir 不太正常，应该是 盘符:/开头才对

点击菜单-工具-高级选项-通用设置-批量翻译时强制串行，选中它，然后保存，再批量试试还有米有报错

#3459 TaskCfgVTT(is_cuda=True, uuid='a40554519c', cache_folder='H:/win-pyvideotrans-v3.97-0303/tmp/33940/a40554519c', target_d

4 Replies

请查阅相关文档：

Post Your Reply

Related resource