#5621 No transcription results returned. Please check the original audio/video or model and try again.Traceback (most recent c

116.16* Posted at: 2 hours ago

No transcription results returned. Please check the original audio/video or model and try again.
Traceback (most recent call last):
File "videotrans\task\only_one.py", line 46, in run
File "videotrans\task\trans_create.py", line 319, in recogn
File "videotrans\recognition\__init__.py", line 191, in run
File "videotrans\recognition\_base.py", line 90, in run
File "videotrans\recognition\_whisper.py", line 38, in _exec
File "videotrans\recognition\_whisper.py", line 124, in _faster
File "videotrans\configure\base.py", line 272, in _new_process
videotrans.configure.excepts.VideoTransError: No transcription results returned. Please check the original audio/video or model and try again.

cfg=[TaskCfgVTT]当前工作模式: 翻译视频或音频 单视频模式
原始输入文件名: D:/.图包/转英文.mp4,
输出结果保存到文件夹: D:/.图包/_video_out/转英文-mp4,
临时文件夹: D:/APP/win-pyvideotrans-v4.03-0626/tmp/10500/469b29717b
已选 清理已存在
未选 启用CUDA加速
未选 降噪
语音识别:faster-whisper(本地内置), model_name: large-v3-turbo, 发音语言: 简体中文, 断句方式:默认断句
翻译渠道:Google(免费),原始语言:简体中文,目标语言:英语, 已选 发送完整字幕
配音渠道:Edge-TTS(免费), 角色:Yan(Female/HK), 配音语言:英语, 未选 二次语音识别
音量:+0%, 语速:+0%, 已选 音频加速, 未选 视频慢速
字幕: 嵌入硬字幕
已选 分离人声与背景声, 已选 重新嵌入背景声, 背景音量0.8, 背景声音时长 短于 视频时长时: 拉长(降速播放),存在分离后的纯净人声文件,存在分离后的背景声音文件
代理地址:


=
system:Windows-10-10.0.22631-SP0
version:v4.03
frozen:True
language:zh
root_dir:D:/APP/win-pyvideotrans-v4.03-0626

1 Replies

No transcription results returned 表示 faster-whisper 模型未能从音频中检测到任何语音内容。结合你的配置(未启用CUDA加速,使用 large-v3-turbo 模型),核心原因是在纯CPU环境下运行大模型导致内存不足或处理异常

解决方案(按推荐顺序尝试):

  1. 切换为更小的模型
    在语音识别渠道中选择 smallbase 模型,它们对CPU内存的需求远低于 large-v3-turbo

    • 操作:主界面 ASR Channel → 修改 model_name 为 smallbase
  2. 确保模型文件完整
    检查 models/models--mobiuslabsgmbh--faster-whisper-large-v3-turbo/ 目录是否包含完整的 .bin.json.txt 文件。如果文件不完整,请重新下载模型或使用 small 等更小模型。
  3. 启用 GPU 加速(如有N卡)
    如果你有 NVIDIA 显卡且安装了 CUDA 12.8+ 和 cuDNN 9.11+,请勾选主界面的 CUDA加速,并确认 nvidia-smi 能正常显示。
  4. 检查音频质量
    虽然你已分离人声,但仍可尝试在主界面点击“设置更多参数”,取消勾选分离人声与背景声,直接对原始音频进行识别,排除分离可能导致的问题。
  5. 调整VAD参数
    高级选项 → 语音识别参数 中,将 语音阈值 降低(例如从默认0.5降至0.3),非语音阈值 减小(例如从0.5降至0.3),确保VAD不误滤掉语音。

若以上步骤仍无效,请提供 logs/ 目录下最新日志文件的最后30行内容,以便进一步定位问题。

Post Your Reply
Open source and free maintenance is not easy. If this project is helpful to you, please consider making a small donation to help the project continue to maintain and update. Dondate: ko-fi.com/jianchang512

Related resource