#5621 No transcription results returned. Please check the original audio/video or model and try again.Traceback (most recent c

116.16* Posted at: 20 days ago

No transcription results returned. Please check the original audio/video or model and try again.
Traceback (most recent call last):
File "videotrans\task\only_one.py", line 46, in run
File "videotrans\task\trans_create.py", line 319, in recogn
File "videotrans\recognition\__init__.py", line 191, in run
File "videotrans\recognition\_base.py", line 90, in run
File "videotrans\recognition\_whisper.py", line 38, in _exec
File "videotrans\recognition\_whisper.py", line 124, in _faster
File "videotrans\configure\base.py", line 272, in _new_process
videotrans.configure.excepts.VideoTransError: No transcription results returned. Please check the original audio/video or model and try again.

cfg=[TaskCfgVTT]当前工作模式: 翻译视频或音频单视频模式
原始输入文件名: D:/.图包/转英文.mp4,
输出结果保存到文件夹: D:/.图包/_video_out/转英文-mp4,
临时文件夹: D:/APP/win-pyvideotrans-v4.03-0626/tmp/10500/469b29717b
已选清理已存在
未选启用CUDA加速
未选降噪
语音识别:faster-whisper(本地内置), model_name: large-v3-turbo, 发音语言: 简体中文, 断句方式:默认断句
翻译渠道:Google(免费),原始语言:简体中文,目标语言:英语, 已选发送完整字幕
配音渠道:Edge-TTS(免费), 角色:Yan(Female/HK), 配音语言:英语, 未选二次语音识别
音量:+0%, 语速:+0%, 已选音频加速, 未选视频慢速
字幕: 嵌入硬字幕
已选分离人声与背景声, 已选重新嵌入背景声, 背景音量0.8, 背景声音时长短于视频时长时: 拉长(降速播放),存在分离后的纯净人声文件,存在分离后的背景声音文件
代理地址:

=
system:Windows-10-10.0.22631-SP0
version:v4.03
frozen:True
language:zh
root_dir:D:/APP/win-pyvideotrans-v4.03-0626

Floor #1 DeepSeek reply at 20 days ago

No transcription results returned 表示 faster-whisper 模型未能从音频中检测到任何语音内容。结合你的配置（未启用CUDA加速，使用 large-v3-turbo 模型），核心原因是在纯CPU环境下运行大模型导致内存不足或处理异常。

解决方案（按推荐顺序尝试）：

切换为更小的模型
在语音识别渠道中选择 small 或 base 模型，它们对CPU内存的需求远低于 large-v3-turbo。
- 操作：主界面 ASR Channel → 修改 model_name 为 small 或 base。
确保模型文件完整
检查 models/models--mobiuslabsgmbh--faster-whisper-large-v3-turbo/ 目录是否包含完整的 .bin、.json、.txt 文件。如果文件不完整，请重新下载模型或使用 small 等更小模型。
启用 GPU 加速（如有N卡）
如果你有 NVIDIA 显卡且安装了 CUDA 12.8+ 和 cuDNN 9.11+，请勾选主界面的 CUDA加速，并确认 nvidia-smi 能正常显示。
检查音频质量
虽然你已分离人声，但仍可尝试在主界面点击“设置更多参数”，取消勾选分离人声与背景声，直接对原始音频进行识别，排除分离可能导致的问题。
调整VAD参数
在 高级选项 → 语音识别参数 中，将 语音阈值 降低（例如从默认0.5降至0.3），非语音阈值 减小（例如从0.5降至0.3），确保VAD不误滤掉语音。

若以上步骤仍无效，请提供 logs/ 目录下最新日志文件的最后30行内容，以便进一步定位问题。

#5621 No transcription results returned. Please check the original audio/video or model and try again.Traceback (most recent c

1 Replies

解决方案（按推荐顺序尝试）：

Post Your Reply

Related resource