#1718 TaskCfg(cache_folder='H:/win-pyvideotrans-v3.86/tmp12556/3a64a10e6b', target_dir='H:/xiazai/_video_out/2025-12-02 06-10-

60.7* Posted at: 6 days ago 👁29

语音识别阶段出错:[阿里FunASR中文(本地)] 处理数据时缺少必需的键:'sentence_info':
Traceback (most recent call last):
File "videotrans\task\job.py", line 113, in run
File "videotrans\task\trans_create.py", line 354, in recogn
File "videotrans\recognition\__init__.py", line 224, in run
File "videotrans\recognition\_base.py", line 78, in run
File "videotrans\recognition\_funasr.py", line 61, in _exec
KeyError: 'sentence_info'

TaskCfg(cache_folder='H:/win-pyvideotrans-v3.86/tmp12556/3a64a10e6b', target_dir='H:/xiazai/_video_out/2025-12-02 06-10-04', remove_noise=False, is_separate=False, detect_language='zh-cn', subtitle_language=None, source_language='简体中文', target_language='简体中文', source_language_code='zh-cn', target_language_code='zh-cn', source_sub='H:/xiazai/_video_out/2025-12-02 06-10-04/zh-cn.srt', target_sub='H:/xiazai/_video_out/2025-12-02 06-10-04/zh-cn.srt', source_wav='H:/win-pyvideotrans-v3.86/tmp12556/3a64a10e6b/zh-cn.wav', source_wav_output='H:/xiazai/_video_out/2025-12-02 06-10-04/zh-cn.m4a', target_wav='H:/win-pyvideotrans-v3.86/tmp12556/3a64a10e6b/target.wav', target_wav_output='H:/xiazai/_video_out/2025-12-02 06-10-04/zh-cn.m4a', subtitles='', novoice_mp4='H:/win-pyvideotrans-v3.86/tmp12556/3a64a10e6b/novoice.mp4', noextname='2025-12-02 06-10-04', shibie_audio=None, targetdir_mp4='H:/xiazai/_video_out/2025-12-02 06-10-04/2025-12-02 06-10-04.mp4', instrument=None, vocal=None, back_audio='', background_music=None, app_mode='tiqu', subtitle_type=0, volume='+0%', pitch='+0Hz', voice_rate='+0%', voice_role='No', copysrt_rawvideo=False, clear_cache=False, translate_type=0, tts_type=0, recogn_type=2, model_name='paraformer-zh', split_type=0, voice_autorate=False, video_autorate=False, cuda=True, name='H:/xiazai/2025-12-02 06-10-04.mp4', basename='2025-12-02 06-10-04.mp4', ext='mp4', dirname='H:/xiazai', shound_del_name=None, uuid='3a64a10e6b', remove_silent_mid=False, align_sub_audio=True, enable_diariz=False, nums_diariz=0, auto_fix=False)


=
system:Windows-10-10.0.26200-SP0
version:v3.86
frozen:True
language:zh
root_dir:H:/win-pyvideotrans-v3.86

3 Replies

此错误表明阿里FunASR本地语音识别在处理返回数据时,未能找到预期的 'sentence_info' 键。这通常是由于FunASR模型文件不完整或版本不匹配导致的。

请按以下步骤解决:

  1. 清理并重新下载模型

    • 前往软件安装目录下的 models/funasr 文件夹(例如 H:/win-pyvideotrans-v3.86/models/funasr)。
    • 删除该文件夹内的所有内容。
    • 重新启动软件,当再次使用“阿里FunASR中文(本地)”进行识别时,软件会自动重新下载所需的模型文件。请确保网络通畅。
  2. 如果问题依旧,请切换识别模型

    • 在软件主界面的“语音识别”区域,将模型从 paraformer-zh 暂时更换为其他模型(例如 qwen-audiofaster-whisper 的某个模型)以完成当前任务。
  3. 检查路径问题

    • 确认您的视频文件路径 H:/xiazai/2025-12-02 06-10-04.mp4 不包含中文字符(虽然“xiazai”是拼音,但日期中的横杠和空格也可能在某些极端情况下引发问题)。可以尝试将视频文件重命名为纯英文短名称(如 test.mp4)并放在简单路径下(如 D:/test.mp4)再次尝试。

如果以上步骤均无效,请提供 H:/win-pyvideotrans-v3.86/logs/ 目录下最新的日志文件以便进一步分析。

删了funasr后又出现
语音识别阶段出错:[阿里FunASR中文(本地)] 处理数据时缺少必需的键:'sentence_info':
Traceback (most recent call last):
File "videotrans\task\job.py", line 113, in run
File "videotrans\task\trans_create.py", line 354, in recogn
File "videotrans\recognition\__init__.py", line 224, in run
File "videotrans\recognition\_base.py", line 78, in run
File "videotrans\recognition\_funasr.py", line 61, in _exec
KeyError: 'sentence_info'

TaskCfg(cache_folder='H:/win-pyvideotrans-v3.86/tmp12556/29a76bd520', target_dir='H:/xiazai/_video_out/test', remove_noise=False, is_separate=False, detect_language='zh-cn', subtitle_language=None, source_language='简体中文', target_language='简体中文', source_language_code='zh-cn', target_language_code='zh-cn', source_sub='H:/xiazai/_video_out/test/zh-cn.srt', target_sub='H:/xiazai/_video_out/test/zh-cn.srt', source_wav='H:/win-pyvideotrans-v3.86/tmp12556/29a76bd520/zh-cn.wav', source_wav_output='H:/xiazai/_video_out/test/zh-cn.m4a', target_wav='H:/win-pyvideotrans-v3.86/tmp12556/29a76bd520/target.wav', target_wav_output='H:/xiazai/_video_out/test/zh-cn.m4a', subtitles='', novoice_mp4='H:/win-pyvideotrans-v3.86/tmp12556/29a76bd520/novoice.mp4', noextname='test', shibie_audio=None, targetdir_mp4='H:/xiazai/_video_out/test/test.mp4', instrument=None, vocal=None, back_audio='', background_music=None, app_mode='tiqu', subtitle_type=0, volume='+0%', pitch='+0Hz', voice_rate='+0%', voice_role='No', copysrt_rawvideo=False, clear_cache=False, translate_type=0, tts_type=0, recogn_type=2, model_name='paraformer-zh', split_type=0, voice_autorate=False, video_autorate=False, cuda=True, name='H:/xiazai/test.mp4', basename='test.mp4', ext='mp4', dirname='H:/xiazai', shound_del_name=None, uuid='29a76bd520', remove_silent_mid=False, align_sub_audio=True, enable_diariz=False, nums_diariz=0, auto_fix=False)

system:Windows-10-10.0.26200-SP0
version:v3.86
frozen:True
language:zh
root_dir:H:/win-pyvideotrans-v3.86

此问题表明阿里FunASR模型下载或初始化失败,导致返回的数据结构不符合预期。请按以下步骤彻底排查:

  1. 检查网络与代理:由于需要从HuggingFace下载模型,请确保您的网络可以正常访问 https://huggingface.co。如果无法直接访问,您需要在软件主界面第5行的“网络代理”中填写有效的代理地址(格式如 http://127.0.0.1:7860)。
  2. 手动下载模型

    • 前往模型仓库:https://huggingface.co/funasr/paraformer-zh
    • 下载 model.pbam.mvn 这两个核心文件。
    • 将它们放入 H:/win-pyvideotrans-v3.86/models/funasr/paraformer-zh 目录中(如果没有此文件夹请手动创建)。
    • 重启软件再试。
  3. 切换识别引擎(临时解决方案)

    • 在软件主界面“语音识别”区域,将识别模型从 “阿里FunASR中文(本地)” 暂时更换为 “faster-whisper(本地)”,并选择一个模型(如 large-v3)。
    • 这是目前最可靠的解决方案,可以绕过FunASR的兼容性问题。
  4. 检查视频音频内容

    • 确认您的视频 test.mp4 确实包含清晰的人声。可以使用播放器单独播放并检查音频轨道是否正常。

如果以上步骤均无效,请提供 H:/win-pyvideotrans-v3.86/logs/ 目录下最新的日志文件,其中可能包含模型下载或初始化的详细错误信息。

Post Your Reply
Open source and free maintenance is not easy. If this project is helpful to you, please consider making a small donation to help the project continue to maintain and update.

Donate: https://ko-fi.com/jianchang512

Trending Questions