#5019 语音识别阶段出错[faster-whisper(本地)] NoneTraceback (most recent call last):File "videotrans\task\job.py", line 35, in runFile "v

103.172* Posted at: 1 month ago

语音识别阶段出错[faster-whisper(本地)] None
Traceback (most recent call last):

File "videotrans\task\job.py", line 35, in run

File "videotrans\task\job.py", line 100, in process_task

File "videotrans\task\trans_create.py", line 322, in recogn

File "videotrans\recognition\__init__.py", line 190, in run

File "videotrans\recognition\_base.py", line 91, in run

File "videotrans\recognition\_whisper.py", line 49, in _download

File "videotrans\recognition\_base.py", line 181, in _vad_split

File "videotrans\configure\base.py", line 253, in _new_process

videotrans.configure.excepts.VideoTransError: None
TaskCfgVTT(uuid='dd3e3ef4e9', name='F:/2026-06-05/01_UE/video/03/03.mp4', dirname='F:/2026-06-05/01_UE/video/03', noextname='03', basename='03.mp4', ext='mp4', target_dir='F:/2026-06-05/01_UE/_video_out/video/03-mp4', cache_folder='D:/win-pyvideotrans-v4.01-0602/tmp/52740/dd3e3ef4e9', is_cuda=True, source_language='英语', source_language_code='en', source_sub='F:/2026-06-05/01_UE/_video_out/video/03-mp4/en.srt', source_wav='D:/win-pyvideotrans-v4.01-0602/tmp/52740/dd3e3ef4e9/en.wav', source_wav_output='F:/2026-06-05/01_UE/_video_out/video/03-mp4/en.m4a', target_language='简体中文', target_language_code='zh-cn', target_sub='F:/2026-06-05/01_UE/_video_out/video/03-mp4/zh-cn.srt', target_wav='D:/win-pyvideotrans-v4.01-0602/tmp/52740/dd3e3ef4e9/target.wav', target_wav_output='F:/2026-06-05/01_UE/_video_out/video/03-mp4/zh-cn.m4a', translate_type=4, tts_type=9, volume='+0%', pitch='+0Hz', voice_rate='+0%', voice_role='Sound_005_90.m4a', voice_autorate=True, video_autorate=False, remove_silent_mid=False, align_sub_audio=True, detect_language='en', recogn_type=0, model_name='large-v3-turbo', shibie_audio=None, remove_noise=False, enable_diariz=False, nums_diariz=0, rephrase=1, fix_punc=True, subtitle_language=None, app_mode='biaozhun', subtitles='', targetdir_mp4='F:/2026-06-05/01_UE/_video_out/video/03-mp4/03.mp4', novoice_mp4='D:/win-pyvideotrans-v4.01-0602/tmp/52740/dd3e3ef4e9/novoice.mp4', is_separate=True, embed_bgm=True, instrument='D:/win-pyvideotrans-v4.01-0602/tmp/52740/dd3e3ef4e9/instrument.wav', vocal='D:/win-pyvideotrans-v4.01-0602/tmp/52740/dd3e3ef4e9/vocal.wav', clear_cache=False, background_music='', subtitle_type=3, only_out_mp4=False, recogn2pass=False, output_srt=2, copysrt_rawvideo=False, loop_backaudio=1, backaudio_volume=0.8)

Floor #1 DeepSeek reply at 1 month ago

该错误的核心原因是：在语音识别阶段，子进程执行 faster-whisper 模型时异常退出，返回了空错误信息（None）。常见诱因包括模型文件下载失败、CUDA环境不匹配或显存不足。

解决步骤（按顺序尝试）

确认网络代理
若在中国大陆，必须配置代理才能从 HuggingFace 下载模型。在主界面“网络代理地址”处填写，格式如 http://127.0.0.1:7890。
若无代理，可手动下载模型文件放入 models/ 目录（参考知识库第20节）。
检查 CUDA 环境
- 运行 nvcc -V 确认 CUDA 编译器版本 ≥ 12.8。
- 确保已安装 cuDNN ≥ 9.11，并将 CUDA 的 bin 和 lib 路径添加至系统环境变量 PATH。
- 若使用多张显卡，软件默认使用第一张卡。若显存不足（如小于 6GB），large-v3-turbo 可能无法加载。
降低模型大小
将语音识别模型切换为 medium 或 small（large-v3-turbo 需要约 4GB 显存，但实际运行还需更多）。在“识别模型”下拉框中选择即可。
手动下载模型
若无法自动下载，请按知识库第20节步骤，下载 large-v3-turbo 模型并放入 models/models--mobiuslabsgmbh--faster-whisper-large-v3-turbo 文件夹（注意文件夹命名必须完全一致）。
临时关闭 GPU 加速
在工具 → 高级选项 → 通用设置中，取消选中 CUDA加速，改用 CPU 运行（速度极慢，仅用于验证问题是否出在 GPU 端）。

如果上述步骤无效

请提供软件安装目录下 logs/ 文件夹中最新日志文件（复制底部约 30 行报错信息），以便进一步分析。可能原因还包括视频文件路径含有特殊符号或文件名过长（如你所见带 01_UE 等），建议将视频重命名为简短英文名（如 03.mp4）并移至浅层目录后重试。

#5019 语音识别阶段出错[faster-whisper(本地)] NoneTraceback (most recent call last):File "videotrans\task\job.py", line 35, in runFile "v

1 Replies

解决步骤（按顺序尝试）

如果上述步骤无效

Post Your Reply

Related resource