#3586 TaskCfgVTT(is_cuda=False, uuid='baf2c222d7', cache_folder='D:/app/win-pyvideotrans-v3.98-312/tmp/14264/baf2c222d7', targ

2409:8a00* Posted at: 3 days ago 👁32

语音识别阶段出错 [faster-whisper(本地)] Unknow error
Traceback (most recent call last):
File "videotrans\task\job.py", line 105, in run
File "videotrans\task\trans_create.py", line 353, in recogn
File "videotrans\recognition\__init__.py", line 265, in run
File "videotrans\recognition\_base.py", line 145, in run
RuntimeError: Unknow error
TaskCfgVTT(is_cuda=False, uuid='baf2c222d7', cache_folder='D:/app/win-pyvideotrans-v3.98-312/tmp/14264/baf2c222d7', target_dir='E:/new/_video_out/d0fa5fd096f967beb88780ab22898388-mp4', source_language='简体中文', source_language_code='zh-cn', source_sub='E:/new/_video_out/d0fa5fd096f967beb88780ab22898388-mp4/zh-cn.srt', source_wav='D:/app/win-pyvideotrans-v3.98-312/tmp/14264/baf2c222d7/zh-cn.wav', source_wav_output='E:/new/_video_out/d0fa5fd096f967beb88780ab22898388-mp4/zh-cn.m4a', target_language='简体中文', target_language_code='zh-cn', target_sub='E:/new/_video_out/d0fa5fd096f967beb88780ab22898388-mp4/zh-cn.srt', target_wav='D:/app/win-pyvideotrans-v3.98-312/tmp/14264/baf2c222d7/target.wav', target_wav_output='E:/new/_video_out/d0fa5fd096f967beb88780ab22898388-mp4/zh-cn.m4a', name='E:/new/d0fa5fd096f967beb88780ab22898388.mp4', noextname='d0fa5fd096f967beb88780ab22898388', basename='d0fa5fd096f967beb88780ab22898388.mp4', ext='mp4', dirname='E:/new', shound_del_name=None, translate_type=0, tts_type=0, volume='+0%', pitch='+0Hz', voice_rate='+0%', voice_role='No', voice_autorate=False, video_autorate=False, remove_silent_mid=False, align_sub_audio=True, detect_language='zh-cn', recogn_type=0, model_name='small', shibie_audio=None, remove_noise=False, enable_diariz=False, nums_diariz=0, rephrase=0, fix_punc=False, subtitle_language=None, app_mode='tiqu', subtitles='', targetdir_mp4='E:/new/_video_out/d0fa5fd096f967beb88780ab22898388-mp4/d0fa5fd096f967beb88780ab22898388.mp4', novoice_mp4='D:/app/win-pyvideotrans-v3.98-312/tmp/14264/baf2c222d7/novoice.mp4', is_separate=False, instrument=None, vocal=None, back_audio='', clear_cache=False, background_music=None, subtitle_type=0, only_out_mp4=False, recogn2pass=True, output_srt=0, copysrt_rawvideo=False)


=
system:Windows-10-10.0.19042-SP0
version:v3.98
frozen:True
language:zh
root_dir:D:/app/win-pyvideotrans-v3.98-312

1 Replies

这是由于 faster-whisper 模型加载或运行过程中出现未知错误导致的。从日志中可以看到 is_cuda=False,表明未启用 CUDA 加速,且使用了 small 模型。这通常与模型文件下载不完整或损坏有关。

解决方案:

  1. 手动下载并替换模型文件

    • 根据你使用的 small 模型,在软件根目录的 models 文件夹内,创建文件夹 models--Systran--faster-whisper-small
    • 访问模型下载地址:https://huggingface.co/Systran/faster-whisper-small/tree/main
    • 将该页面所有 .json.bin.txt 文件下载后,复制到上一步创建的文件夹内(覆盖已有文件)。
  2. 尝试启用 CUDA 加速(如果具备条件)

    • 如果你有 NVIDIA 显卡,请确保已正确安装 CUDA 12.8 和 cuDNN 9.x。
    • 在主界面勾选 CUDA加速 选项。
    • 如果启用 CUDA 后出现其他错误,可能是显存不足,可尝试更换为更小的模型(如 tinybase),但这会降低识别准确度。
  3. 清理缓存并重试

    • 在软件主界面,勾选 清理已生成 选项,然后重新处理视频。
  4. 更换语音识别渠道

    • 如果问题持续,可以暂时切换到其他语音识别渠道,例如 Qwen-ASR(本地)(对中文友好)或 openai-whisper(本地)

请查阅相关文档:

Post Your Reply
Open source and free maintenance is not easy. If this project is helpful to you, please consider making a small donation to help the project continue to maintain and update.

Related resource