#4261 TaskCfgVTT(is_cuda=True, uuid='b0494ae0f9', cache_folder='D:/sp/tmp/2960/b0494ae0f9', target_dir='D:/B/_video_out/hhd800

240e:39e* Posted at: 2 months ago

语音识别阶段出错 [Huggingface_ASR] No recognition results found:reazon-research/japanese-wav2vec2-large-rs35kh
Traceback (most recent call last):
File "videotrans\task\job.py", line 105, in run
File "videotrans\task\trans_create.py", line 380, in recogn
File "videotrans\recognition\__init__.py", line 280, in run
File "videotrans\recognition\_base.py", line 143, in run
File "videotrans\recognition\_huggingface.py", line 41, in _exec
RuntimeError: No recognition results found:reazon-research/japanese-wav2vec2-large-rs35kh
TaskCfgVTT(is_cuda=True, uuid='b0494ae0f9', cache_folder='D:/sp/tmp/2960/b0494ae0f9', target_dir='D:/B/_video_out/[email protected]1_8K-mp4', source_language='日语', source_language_code='ja', source_sub='D:/B/_video_out/[email protected]1_8K-mp4/ja.srt', source_wav='D:/sp/tmp/2960/b0494ae0f9/ja.wav', source_wav_output='D:/B/_video_out/[email protected]1_8K-mp4/ja.m4a', target_language='简体中文', target_language_code='zh-cn', target_sub='D:/B/_video_out/[email protected]1_8K-mp4/zh-cn.srt', target_wav='D:/sp/tmp/2960/b0494ae0f9/target.wav', target_wav_output='D:/B/_video_out/[email protected]1_8K-mp4/zh-cn.m4a', name='D:/B/[email protected]1_8K.mp4', noextname='[email protected]1_8K', basename='[email protected]1_8K.mp4', ext='mp4', dirname='D:/B', shound_del_name=None, translate_type=1, tts_type=5, volume='+0%', pitch='+0Hz', voice_rate='+0%', voice_role='千雪(Chelsie)', voice_autorate=True, video_autorate=False, remove_silent_mid=False, align_sub_audio=True, detect_language='ja', recogn_type=4, model_name='reazon-research/japanese-wav2vec2-large-rs35kh', shibie_audio=None, remove_noise=False, enable_diariz=False, nums_diariz=0, rephrase=0, fix_punc=False, subtitle_language=None, app_mode='biaozhun', subtitles='', targetdir_mp4='D:/B/_video_out/[email protected]1_8K-mp4/[email protected]1_8K.mp4', novoice_mp4='D:/sp/tmp/2960/b0494ae0f9/novoice.mp4', is_separate=False, embed_bgm=False, instrument=None, vocal='D:/sp/tmp/2960/b0494ae0f9/vocal.wav', back_audio='', clear_cache=False, background_music=None, subtitle_type=2, only_out_mp4=False, recogn2pass=True, output_srt=0, copysrt_rawvideo=False)

=
system:Windows-10-10.0.26100-SP0
version:v3.99
frozen:True
language:zh
root_dir:D:/sp

Floor #1 DeepSeek reply at 2 months ago

该错误表示 HuggingFace_ASR 模型 reazon-research/japanese-wav2vec2-large-rs35kh 未能从输入音频中识别出任何语音内容。

请按以下步骤排查：

检查模型是否已正确下载
在软件根目录 D:/sp/models 下查找是否存在 models--reazon-research--japanese-wav2vec2-large-rs35kh 文件夹，若缺失或文件不完整，需重新下载。推荐手动从 HuggingFace 镜像下载后放入该目录。
验证输入音频质量
确认视频中确实包含清晰的日语语音，且音量足够。可尝试先使用“批量语音转字幕”功能，选择 faster-whisper(本地) large-v3 模型测试同一视频，若能正常识别，则说明问题出在 HuggingFace 模型本身。
换用更稳定的 ASR 渠道
对于日语，推荐改用 HuggingFace_ASR 中的 kotoba-whisper 模型，或直接使用 faster-whisper(本地) large-v3，后者对日语支持良好且无需额外下载。
检查网络与代理
如果模型首次使用时在线下载，国内可能需配置代理（http://127.0.0.1:端口）或使用镜像站。
查看详细日志
在 D:/sp/logs/ 文件夹中找到最新日志文件，搜索 reazon 或 No recognition 查看更多上下文，确认是否加载模型时出错。

#4261 TaskCfgVTT(is_cuda=True, uuid='b0494ae0f9', cache_folder='D:/sp/tmp/2960/b0494ae0f9', target_dir='D:/B/_video_out/hhd800

1 Replies

请查阅相关文档：

Post Your Reply

Related resource