#4653 语音识别时所有字幕都首尾相连,尽管没有声音,下一句字幕还是挂着

120.236* Posted at: 2 hours ago 👁7

语音识别时所有字幕都首尾相连,尽管没有声音,下一句字幕还是挂着

1 Replies

这是由于VAD(语音活动检测)参数或字幕合并设置不当,导致静音部分未被正确切分。

  1. 增加“静音分割持续毫秒”值:在菜单 → 工具/选项 → 高级选项 → 语音识别参数中,将“静音分割持续毫秒”设置为 500 或更大(单位ms),确保仅在足够长的静音处分割。
  2. 关闭“合并过短字幕到邻近”:在高级选项 → 语音识别参数中,取消勾选该项,避免短静音片段被强行合并。
  3. 增大“最短语音持续毫秒”:建议设为 2000ms 以上,避免噪音或短暂声音被识别为字幕。
  4. 检查VAD模型:可在高级选项中尝试切换为 sileroten-vad,确保对静音敏感度合适。

请查阅相关文档:

Post Your Reply
Open source and free maintenance is not easy. If this project is helpful to you, please consider making a small donation to help the project continue to maintain and update.

Related resource