#4982 TaskCfgVTT(uuid='724416a535', name='C:/Users/yue/Desktop/1000.mp4', dirname='C:/Users/yue/Desktop', noextname='1000', ba

240e:3a1* Posted at: 1 month ago

No transcription results returned. Please check the original audio/video or model and try again.语音识别阶段出错:faster-whisper(本地), 翻译字幕阶段出错: Google(免费), 配音阶段出错:Edge-TTS(免费)
Traceback (most recent call last):
File "videotrans\task\only_one.py", line 47, in run
File "videotrans\task\trans_create.py", line 322, in recogn
File "videotrans\recognition\__init__.py", line 190, in run
File "videotrans\recognition\_base.py", line 94, in run
File "videotrans\recognition\_whisper.py", line 36, in _exec
File "videotrans\recognition\_whisper.py", line 109, in _faster
File "videotrans\configure\base.py", line 253, in _new_process
videotrans.configure.excepts.VideoTransError: No transcription results returned. Please check the original audio/video or model and try again.
TaskCfgVTT(uuid='724416a535', name='C:/Users/yue/Desktop/1000.mp4', dirname='C:/Users/yue/Desktop', noextname='1000', basename='1000.mp4', ext='mp4', target_dir='C:/Users/yue/Desktop/_video_out/1000-mp4', cache_folder='D:/pyVideoTrans/tmp/52584/724416a535', is_cuda=False, source_language='简体中文', source_language_code='zh-cn', source_sub='C:/Users/yue/Desktop/_video_out/1000-mp4/zh-cn.srt', source_wav='D:/pyVideoTrans/tmp/52584/724416a535/remove_noise.wav', source_wav_output='C:/Users/yue/Desktop/_video_out/1000-mp4/zh-cn.m4a', target_language='英语', target_language_code='en', target_sub='C:/Users/yue/Desktop/_video_out/1000-mp4/en.srt', target_wav='D:/pyVideoTrans/tmp/52584/724416a535/target.wav', target_wav_output='C:/Users/yue/Desktop/_video_out/1000-mp4/en.m4a', translate_type=0, tts_type=0, volume='+0%', pitch='+0Hz', voice_rate='+0%', voice_role='No', voice_autorate=True, video_autorate=False, remove_silent_mid=False, align_sub_audio=True, detect_language='zh-cn', recogn_type=0, model_name='base', shibie_audio=None, remove_noise=True, enable_diariz=False, nums_diariz=0, rephrase=0, fix_punc=False, subtitle_language=None, app_mode='biaozhun', subtitles='', targetdir_mp4='C:/Users/yue/Desktop/_video_out/1000-mp4/1000.mp4', novoice_mp4='D:/pyVideoTrans/tmp/52584/724416a535/novoice.mp4', is_separate=True, embed_bgm=True, instrument='D:/pyVideoTrans/tmp/52584/724416a535/instrument.wav', vocal='D:/pyVideoTrans/tmp/52584/724416a535/vocal.wav', clear_cache=True, background_music='', subtitle_type=1, only_out_mp4=False, recogn2pass=False, output_srt=0, copysrt_rawvideo=False, loop_backaudio=1, backaudio_volume=0.8)

=
system:Windows-10-10.0.26200-SP0
version:v4.01
frozen:True
language:zh
root_dir:D:/pyVideoTrans

Floor #1 DeepSeek reply at 1 month ago

语音识别阶段未返回任何结果，说明 faster-whisper(base) 模型未能从音频中提取出有效文本。常见原因包括：音频中无人声、原始语言选择错误、模型下载不完整，或背景噪声干扰导致无声输出。

请按以下步骤排查：

验证视频音轨：用播放器打开 1000.mp4，确认视频确实包含人类说话声，且语言为简体中文。如果只有背景音乐或无语音，软件无法处理。
临时关闭附加功能：当前开启了“降噪”和“分离人声背景声”，这两个步骤会显著增加处理时间，且可能因模型加载失败导致结果为空。建议：
- 取消勾选主界面的“降噪”。
- 在“设置更多参数”中取消“分离人声背景声”。
- 重新执行，仅保留基础的语音识别。
更换语音识别渠道：对于中文语音，faster-whisper(base) 模型太小且准确率低。强烈建议改用 Qwen-ASR(本地) 或 阿里FunASR(本地)，它们对中文支持更好：
- 主界面“语音识别”下拉框中选择 qwen-asr(本地) 或 阿里FunASR(本地)，模型选择 paraformer-zh。
- 首次使用会自动下载模型，请保持网络畅通。
检查模型文件：若仍失败，请查看软件目录下的 models/ 文件夹，确认 faster-whisper-base 模型已完整下载（文件夹名应为 models--Systran--faster-whisper-base）。若未下载或损坏，可手动下载后放入该目录。
提供日志：如果以上步骤无效，请打开软件根目录的 logs/ 文件夹，将最近日期的 .log 文件底部约30行内容粘贴给我，以便进一步分析。

#4982 TaskCfgVTT(uuid='724416a535', name='C:/Users/yue/Desktop/1000.mp4', dirname='C:/Users/yue/Desktop', noextname='1000', ba

1 Replies

请查阅相关文档：

Post Your Reply

Related resource