#5373 cfg=TaskCfgSTT(uuid='c7289c8c80', name='D:/oo/looks.wim/LOOK1/laojin.one@(1).mp4', dirname='D:/oo/looks.wim/LOOK1', noex

223.160* Posted at: 1 day ago

语音识别阶段出错[阿里FunASR(本地)(本地内置)] None
Traceback (most recent call last):

File "videotrans\task\job.py", line 35, in run

File "videotrans\task\job.py", line 100, in process_task

File "videotrans\task\speech2text.py", line 97, in recogn

File "videotrans\recognition\__init__.py", line 191, in run

File "videotrans\recognition\_base.py", line 90, in run

File "videotrans\recognition\_funasr.py", line 46, in _exec

File "videotrans\recognition\_base.py", line 194, in cut_audio

File "videotrans\recognition\_base.py", line 179, in _vad_split

File "videotrans\configure\base.py", line 272, in _new_process

videotrans.configure.excepts.VideoTransError: None
cfg=TaskCfgSTT(uuid='c7289c8c80', name='D:/oo/looks.wim/LOOK1/laojin.one@(1).mp4', dirname='D:/oo/looks.wim/LOOK1', noextname='laojin.one@(1)', basename='laojin.one@(1).mp4', ext='mp4', target_dir='D:/Tool/win-pyvideotrans-v4.03-0622/output/recogn', cache_folder='D:/Tool/win-pyvideotrans-v4.03-0622/tmp/6020/c7289c8c80', is_cuda=True, source_language=None, source_language_code=None, source_sub=None, source_wav=None, source_wav_output=None, target_language=None, target_language_code=None, target_sub='D:/Tool/win-pyvideotrans-v4.03-0622/output/recogn/laojin.one@(1).srt', target_wav=None, target_wav_output=None, detect_language='zh-cn', recogn_type=3, model_name='Fun-ASR-MLT-Nano-2512', shibie_audio='D:/Tool/win-pyvideotrans-v4.03-0622/tmp/6020/c7289c8c80/laojin.one@(1)-1782141739.6779168.wav', remove_noise=False, enable_diariz=False, nums_diariz=0, rephrase=0, fix_punc=2)


=
system:Windows-10-10.0.26200-SP0
version:v4.03
frozen:True
language:zh
root_dir:D:/Tool/win-pyvideotrans-v4.03-0622

3 Replies

阿里 FunASR 语音识别失败,错误信息无具体说明,原因通常是 模型文件下载不完整或 VAD 分割组件缺失

请按以下步骤排查:

  1. 删除模型并重新下载
    关闭软件,删除 models/ 下的 FunASR 相关文件夹(名字含 Fun-ASR-MLT-Nano-2512),重新运行软件,它会自动重新下载模型。
  2. 检查网络与代理
    首次下载模型需要访问 huggingface 或 ModelScope,如果在国内,请确保软件已配置正确的代理(主界面第5行“网络代理”处填写)。若无需代理,请清空代理框。
  3. 确认 VAD 模型存在
    检查 models/ 目录下是否有 silero_vad.onnx 或类似 VAD 模型文件(大小约 4MB)。如果缺失,可手动从 ModelScope 下载 silero_vad.onnx 放入 models/ 目录。
  4. 临时更换识别渠道
    若仍失败,建议先切换到 faster-whisper(本地) large-v3 渠道,确保其他功能可用。
  5. 优化文件路径
    视频路径 D:/oo/looks.wim/LOOK1/laojin.one@(1).mp4 含有特殊符号 @ 和括号,建议重命名为纯英文数字(如 test.mp4),防止路径解析异常。

若以上操作后问题依旧,请提供 logs/ 目录下最新日志文件(复制报错前后共 30 行内容),以便进一步分析。

请查阅相关文档:

mm

请先尝试重置阿里 FunASR 模型:

  1. 删除 models/ 下的 Fun-ASR-MLT-Nano-2512 或相关文件夹。
  2. 重新启动软件,让软件自动下载完整模型。
  3. 如果下载慢,手动从 ModelScope镜像 下载对应模型文件,放入 models/ 目录。

若仍有问题,请提供 logs/ 下最新的日志文件内容,以便进一步排查。

Post Your Reply
Open source and free maintenance is not easy. If this project is helpful to you, please consider making a small donation to help the project continue to maintain and update. Dondate: ko-fi.com/jianchang512

Related resource