#1718 TaskCfg(cache_folder='H:/win-pyvideotrans-v3.86/tmp12556/3a64a10e6b', target_dir='H:/xiazai/_video_out/2025-12-02 06-10-

60.7* Posted at: 7 months ago

语音识别阶段出错:[阿里FunASR中文(本地)] 处理数据时缺少必需的键：'sentence_info':
Traceback (most recent call last):
File "videotrans\task\job.py", line 113, in run
File "videotrans\task\trans_create.py", line 354, in recogn
File "videotrans\recognition\__init__.py", line 224, in run
File "videotrans\recognition\_base.py", line 78, in run
File "videotrans\recognition\_funasr.py", line 61, in _exec
KeyError: 'sentence_info'

TaskCfg(cache_folder='H:/win-pyvideotrans-v3.86/tmp12556/3a64a10e6b', target_dir='H:/xiazai/_video_out/2025-12-02 06-10-04', remove_noise=False, is_separate=False, detect_language='zh-cn', subtitle_language=None, source_language='简体中文', target_language='简体中文', source_language_code='zh-cn', target_language_code='zh-cn', source_sub='H:/xiazai/_video_out/2025-12-02 06-10-04/zh-cn.srt', target_sub='H:/xiazai/_video_out/2025-12-02 06-10-04/zh-cn.srt', source_wav='H:/win-pyvideotrans-v3.86/tmp12556/3a64a10e6b/zh-cn.wav', source_wav_output='H:/xiazai/_video_out/2025-12-02 06-10-04/zh-cn.m4a', target_wav='H:/win-pyvideotrans-v3.86/tmp12556/3a64a10e6b/target.wav', target_wav_output='H:/xiazai/_video_out/2025-12-02 06-10-04/zh-cn.m4a', subtitles='', novoice_mp4='H:/win-pyvideotrans-v3.86/tmp12556/3a64a10e6b/novoice.mp4', noextname='2025-12-02 06-10-04', shibie_audio=None, targetdir_mp4='H:/xiazai/_video_out/2025-12-02 06-10-04/2025-12-02 06-10-04.mp4', instrument=None, vocal=None, back_audio='', background_music=None, app_mode='tiqu', subtitle_type=0, volume='+0%', pitch='+0Hz', voice_rate='+0%', voice_role='No', copysrt_rawvideo=False, clear_cache=False, translate_type=0, tts_type=0, recogn_type=2, model_name='paraformer-zh', split_type=0, voice_autorate=False, video_autorate=False, cuda=True, name='H:/xiazai/2025-12-02 06-10-04.mp4', basename='2025-12-02 06-10-04.mp4', ext='mp4', dirname='H:/xiazai', shound_del_name=None, uuid='3a64a10e6b', remove_silent_mid=False, align_sub_audio=True, enable_diariz=False, nums_diariz=0, auto_fix=False)

=
system:Windows-10-10.0.26200-SP0
version:v3.86
frozen:True
language:zh
root_dir:H:/win-pyvideotrans-v3.86

Floor #1 DeepSeek reply at 7 months ago

此错误表明阿里FunASR本地语音识别在处理返回数据时，未能找到预期的 'sentence_info' 键。这通常是由于FunASR模型文件不完整或版本不匹配导致的。

请按以下步骤解决：

清理并重新下载模型：
- 前往软件安装目录下的 models/funasr 文件夹（例如 H:/win-pyvideotrans-v3.86/models/funasr）。
- 删除该文件夹内的所有内容。
- 重新启动软件，当再次使用“阿里FunASR中文(本地)”进行识别时，软件会自动重新下载所需的模型文件。请确保网络通畅。
如果问题依旧，请切换识别模型：
- 在软件主界面的“语音识别”区域，将模型从 paraformer-zh 暂时更换为其他模型（例如 qwen-audio 或 faster-whisper 的某个模型）以完成当前任务。
检查路径问题：
- 确认您的视频文件路径 H:/xiazai/2025-12-02 06-10-04.mp4 不包含中文字符（虽然“xiazai”是拼音，但日期中的横杠和空格也可能在某些极端情况下引发问题）。可以尝试将视频文件重命名为纯英文短名称（如 test.mp4）并放在简单路径下（如 D:/test.mp4）再次尝试。

如果以上步骤均无效，请提供 H:/win-pyvideotrans-v3.86/logs/ 目录下最新的日志文件以便进一步分析。

Floor #2 60.7* reply at 7 months ago

删了funasr后又出现
语音识别阶段出错:[阿里FunASR中文(本地)] 处理数据时缺少必需的键：'sentence_info':
Traceback (most recent call last):
File "videotrans\task\job.py", line 113, in run
File "videotrans\task\trans_create.py", line 354, in recogn
File "videotrans\recognition\__init__.py", line 224, in run
File "videotrans\recognition\_base.py", line 78, in run
File "videotrans\recognition\_funasr.py", line 61, in _exec
KeyError: 'sentence_info'

TaskCfg(cache_folder='H:/win-pyvideotrans-v3.86/tmp12556/29a76bd520', target_dir='H:/xiazai/_video_out/test', remove_noise=False, is_separate=False, detect_language='zh-cn', subtitle_language=None, source_language='简体中文', target_language='简体中文', source_language_code='zh-cn', target_language_code='zh-cn', source_sub='H:/xiazai/_video_out/test/zh-cn.srt', target_sub='H:/xiazai/_video_out/test/zh-cn.srt', source_wav='H:/win-pyvideotrans-v3.86/tmp12556/29a76bd520/zh-cn.wav', source_wav_output='H:/xiazai/_video_out/test/zh-cn.m4a', target_wav='H:/win-pyvideotrans-v3.86/tmp12556/29a76bd520/target.wav', target_wav_output='H:/xiazai/_video_out/test/zh-cn.m4a', subtitles='', novoice_mp4='H:/win-pyvideotrans-v3.86/tmp12556/29a76bd520/novoice.mp4', noextname='test', shibie_audio=None, targetdir_mp4='H:/xiazai/_video_out/test/test.mp4', instrument=None, vocal=None, back_audio='', background_music=None, app_mode='tiqu', subtitle_type=0, volume='+0%', pitch='+0Hz', voice_rate='+0%', voice_role='No', copysrt_rawvideo=False, clear_cache=False, translate_type=0, tts_type=0, recogn_type=2, model_name='paraformer-zh', split_type=0, voice_autorate=False, video_autorate=False, cuda=True, name='H:/xiazai/test.mp4', basename='test.mp4', ext='mp4', dirname='H:/xiazai', shound_del_name=None, uuid='29a76bd520', remove_silent_mid=False, align_sub_audio=True, enable_diariz=False, nums_diariz=0, auto_fix=False)

system:Windows-10-10.0.26200-SP0
version:v3.86
frozen:True
language:zh
root_dir:H:/win-pyvideotrans-v3.86

Floor #3 DeepSeek reply at 7 months ago

此问题表明阿里FunASR模型下载或初始化失败，导致返回的数据结构不符合预期。请按以下步骤彻底排查：

检查网络与代理：由于需要从HuggingFace下载模型，请确保您的网络可以正常访问 https://huggingface.co。如果无法直接访问，您需要在软件主界面第5行的“网络代理”中填写有效的代理地址（格式如 http://127.0.0.1:7860）。
手动下载模型：
- 前往模型仓库：https://huggingface.co/funasr/paraformer-zh。
- 下载 model.pb 和 am.mvn 这两个核心文件。
- 将它们放入 H:/win-pyvideotrans-v3.86/models/funasr/paraformer-zh 目录中（如果没有此文件夹请手动创建）。
- 重启软件再试。
切换识别引擎（临时解决方案）：
- 在软件主界面“语音识别”区域，将识别模型从 “阿里FunASR中文(本地)” 暂时更换为 “faster-whisper(本地)”，并选择一个模型（如 large-v3）。
- 这是目前最可靠的解决方案，可以绕过FunASR的兼容性问题。
检查视频音频内容：
- 确认您的视频 test.mp4 确实包含清晰的人声。可以使用播放器单独播放并检查音频轨道是否正常。

如果以上步骤均无效，请提供 H:/win-pyvideotrans-v3.86/logs/ 目录下最新的日志文件，其中可能包含模型下载或初始化的详细错误信息。

#1718 TaskCfg(cache_folder='H:/win-pyvideotrans-v3.86/tmp12556/3a64a10e6b', target_dir='H:/xiazai/_video_out/2025-12-02 06-10-

3 Replies

Post Your Reply

Related resource