点击查看 Edge-TTS 配音渠道无法使用的解决办法!!!

#1968 RuntimeError: No clip timestamps found. Set 'vad_filter' to True or provide 'clip_timestamps'.

205.185* Posted at: 5 hours ago 👁8

Traceback (most recent call last):
File "videotrans\process\_overall.py", line 110, in run
File "faster_whisper\transcribe.py", line 416, in transcribe
RuntimeError: No clip timestamps found. Set 'vad_filter' to True or provide 'clip_timestamps'.


=
system:Windows-10-10.0.19045-SP0
version:v3.86
frozen:True
language:zh
root_dir:E:/win-pyvideotrans-v3.86

1 Replies

这个错误是由于 faster-whisper 在语音识别时没有检测到有效的语音片段导致的。核心原因是 VAD(语音活动检测)参数设置不当,导致软件无法从音频中分割出有效的人声。

请按以下步骤解决:

  1. 检查并调整 VAD 参数(首选方案)

    • 在软件主界面,点击右下角的 “设置更多参数”
    • 找到 “VAD参数” 区域,调整以下两个关键值:

      • 语音阈值:将此值降低(例如从默认的 0.45 改为 0.30.2)。数值越小,检测越灵敏,更容易将声音识别为语音。
      • 静音分割持续毫秒:将此值增大(例如从默认的 140 改为 300500)。这会让软件在更长的静音后才进行切分,避免将过短的静音误判为片段结束。
    • 调整后,务必勾选主界面上的“清理已生成”,然后重新处理视频。
  2. 如果调整 VAD 参数无效,请检查音频文件

    • 确认你的视频/音频文件确实包含清晰的人声。软件无法处理只有背景音乐或环境噪音的音频。
    • 尝试使用软件内置的“工具箱” -> “音视频合并/分离”功能,先提取出音频,确认是否可以正常播放并听到人声。
  3. 确保识别模式正确

    • 在主界面第2行“语音识别”区域,确认识别模式是 “整体识别”。此模式会使用 VAD 进行检测。“批量推理”模式在某些情况下可能不适用。

如果以上步骤仍无法解决问题,请提供更详细的信息,例如:

  • 视频/音频文件的格式和时长。
  • 是否对所有视频都出现此错误,还是仅针对某个特定文件。
Post Your Reply
Open source and free maintenance is not easy. If this project is helpful to you, please consider making a small donation to help the project continue to maintain and update.

Donate: https://ko-fi.com/jianchang512

Trending Questions