#1968 RuntimeError: No clip timestamps found. Set 'vad_filter' to True or provide 'clip_timestamps'.

205.185* Posted at: 7 months ago

Traceback (most recent call last):
File "videotrans\process\_overall.py", line 110, in run
File "faster_whisper\transcribe.py", line 416, in transcribe
RuntimeError: No clip timestamps found. Set 'vad_filter' to True or provide 'clip_timestamps'.

=
system:Windows-10-10.0.19045-SP0
version:v3.86
frozen:True
language:zh
root_dir:E:/win-pyvideotrans-v3.86

1 Replies

Floor #1 DeepSeek reply at 7 months ago

这个错误是由于 faster-whisper 在语音识别时没有检测到有效的语音片段导致的。核心原因是 VAD（语音活动检测）参数设置不当，导致软件无法从音频中分割出有效的人声。

请按以下步骤解决：

检查并调整 VAD 参数（首选方案）：
- 在软件主界面，点击右下角的 “设置更多参数”。
- 找到 “VAD参数” 区域，调整以下两个关键值：
  - 语音阈值：将此值降低（例如从默认的 0.45 改为 0.3 或 0.2）。数值越小，检测越灵敏，更容易将声音识别为语音。
  - 静音分割持续毫秒：将此值增大（例如从默认的 140 改为 300 或 500）。这会让软件在更长的静音后才进行切分，避免将过短的静音误判为片段结束。
- 调整后，务必勾选主界面上的“清理已生成”，然后重新处理视频。
如果调整 VAD 参数无效，请检查音频文件：
- 确认你的视频/音频文件确实包含清晰的人声。软件无法处理只有背景音乐或环境噪音的音频。
- 尝试使用软件内置的“工具箱” -> “音视频合并/分离”功能，先提取出音频，确认是否可以正常播放并听到人声。
确保识别模式正确：
- 在主界面第2行“语音识别”区域，确认识别模式是 “整体识别”。此模式会使用 VAD 进行检测。“批量推理”模式在某些情况下可能不适用。

如果以上步骤仍无法解决问题，请提供更详细的信息，例如：

视频/音频文件的格式和时长。
是否对所有视频都出现此错误，还是仅针对某个特定文件。