#5019 语音识别阶段出错[faster-whisper(本地)] NoneTraceback (most recent call last):File "videotrans\task\job.py", line 35, in runFile "v

103.172* Posted at: 12 hours ago

语音识别阶段出错[faster-whisper(本地)] None
Traceback (most recent call last):

File "videotrans\task\job.py", line 35, in run

File "videotrans\task\job.py", line 100, in process_task

File "videotrans\task\trans_create.py", line 322, in recogn

File "videotrans\recognition\__init__.py", line 190, in run

File "videotrans\recognition\_base.py", line 91, in run

File "videotrans\recognition\_whisper.py", line 49, in _download

File "videotrans\recognition\_base.py", line 181, in _vad_split

File "videotrans\configure\base.py", line 253, in _new_process

videotrans.configure.excepts.VideoTransError: None
TaskCfgVTT(uuid='dd3e3ef4e9', name='F:/2026-06-05/01_UE/video/03/03.mp4', dirname='F:/2026-06-05/01_UE/video/03', noextname='03', basename='03.mp4', ext='mp4', target_dir='F:/2026-06-05/01_UE/_video_out/video/03-mp4', cache_folder='D:/win-pyvideotrans-v4.01-0602/tmp/52740/dd3e3ef4e9', is_cuda=True, source_language='英语', source_language_code='en', source_sub='F:/2026-06-05/01_UE/_video_out/video/03-mp4/en.srt', source_wav='D:/win-pyvideotrans-v4.01-0602/tmp/52740/dd3e3ef4e9/en.wav', source_wav_output='F:/2026-06-05/01_UE/_video_out/video/03-mp4/en.m4a', target_language='简体中文', target_language_code='zh-cn', target_sub='F:/2026-06-05/01_UE/_video_out/video/03-mp4/zh-cn.srt', target_wav='D:/win-pyvideotrans-v4.01-0602/tmp/52740/dd3e3ef4e9/target.wav', target_wav_output='F:/2026-06-05/01_UE/_video_out/video/03-mp4/zh-cn.m4a', translate_type=4, tts_type=9, volume='+0%', pitch='+0Hz', voice_rate='+0%', voice_role='Sound_005_90.m4a', voice_autorate=True, video_autorate=False, remove_silent_mid=False, align_sub_audio=True, detect_language='en', recogn_type=0, model_name='large-v3-turbo', shibie_audio=None, remove_noise=False, enable_diariz=False, nums_diariz=0, rephrase=1, fix_punc=True, subtitle_language=None, app_mode='biaozhun', subtitles='', targetdir_mp4='F:/2026-06-05/01_UE/_video_out/video/03-mp4/03.mp4', novoice_mp4='D:/win-pyvideotrans-v4.01-0602/tmp/52740/dd3e3ef4e9/novoice.mp4', is_separate=True, embed_bgm=True, instrument='D:/win-pyvideotrans-v4.01-0602/tmp/52740/dd3e3ef4e9/instrument.wav', vocal='D:/win-pyvideotrans-v4.01-0602/tmp/52740/dd3e3ef4e9/vocal.wav', clear_cache=False, background_music='', subtitle_type=3, only_out_mp4=False, recogn2pass=False, output_srt=2, copysrt_rawvideo=False, loop_backaudio=1, backaudio_volume=0.8)

1 Replies

该错误的核心原因是:在语音识别阶段,子进程执行 faster-whisper 模型时异常退出,返回了空错误信息(None)。常见诱因包括模型文件下载失败、CUDA环境不匹配或显存不足。

解决步骤(按顺序尝试)

  1. 确认网络代理
    若在中国大陆,必须配置代理才能从 HuggingFace 下载模型。在主界面“网络代理地址”处填写,格式如 http://127.0.0.1:7890
    若无代理,可手动下载模型文件放入 models/ 目录(参考知识库第20节)。
  2. 检查 CUDA 环境

    • 运行 nvcc -V 确认 CUDA 编译器版本 ≥ 12.8。
    • 确保已安装 cuDNN ≥ 9.11,并将 CUDA 的 binlib 路径添加至系统环境变量 PATH
    • 若使用多张显卡,软件默认使用第一张卡。若显存不足(如小于 6GB),large-v3-turbo 可能无法加载。
  3. 降低模型大小
    将语音识别模型切换为 mediumsmalllarge-v3-turbo 需要约 4GB 显存,但实际运行还需更多)。在“识别模型”下拉框中选择即可。
  4. 手动下载模型
    若无法自动下载,请按知识库第20节步骤,下载 large-v3-turbo 模型并放入 models/models--mobiuslabsgmbh--faster-whisper-large-v3-turbo 文件夹(注意文件夹命名必须完全一致)。
  5. 临时关闭 GPU 加速
    在工具 → 高级选项 → 通用设置中,取消选中 CUDA加速,改用 CPU 运行(速度极慢,仅用于验证问题是否出在 GPU 端)。

如果上述步骤无效

请提供软件安装目录下 logs/ 文件夹中最新日志文件(复制底部约 30 行报错信息),以便进一步分析。可能原因还包括视频文件路径含有特殊符号或文件名过长(如你所见带 01_UE 等),建议将视频重命名为简短英文名(如 03.mp4)并移至浅层目录后重试。

Post Your Reply
Open source and free maintenance is not easy. If this project is helpful to you, please consider making a small donation to help the project continue to maintain and update. Dondate: ko-fi.com/jianchang512

Related resource