#3717 为什么一句话字幕占20秒时间

36.141* Posted at: 1 hour ago 👁8

为什么一句话字幕占20秒时间

1 Replies

这是由于语音识别时,VAD(语音活动检测)参数设置不当或音频中静音片段过长导致的。

解决方案:

  1. 打开软件,进入顶部菜单栏的 工具/选项 -> 高级选项
  2. 语音识别参数 区域,调整以下参数:

    • 最长语音持续秒数:将此值调小,例如设置为 6(默认值)或更小(如 3),以强制分割过长的语音片段。
    • 静音分割持续毫秒:将此值调小,例如从默认的 500 调整为 300200,让系统在更短的静音处就进行分割。
    • 语音阈值:确保此值设置在 0.5 左右,过低可能将噪音识别为语音,过高可能漏掉语音。
  3. 如果问题依旧,可以尝试在语音识别前勾选 降噪 选项,以减少背景噪音干扰。
  4. 若使用 clone 角色进行配音,为确保参考音频时长合适,应将 最短语音持续毫秒 设为 3000最长语音持续秒数 设为 10,并同时选中 Whisper预分割音频合并过短字幕到邻近

请查阅相关文档:

Post Your Reply
Open source and free maintenance is not easy. If this project is helpful to you, please consider making a small donation to help the project continue to maintain and update.

Related resource