#4319 生成的字幕有很多“啊”哦嗯等语气词

240e:39e* Posted at: 6 hours ago 👁9

生成的字幕有很多“啊”哦嗯等语气词

1 Replies

识别结果中包含大量语气词(如“啊”、“哦”、“嗯”)通常是因为语音活动检测(VAD)的阈值设置过低,导致将短暂的非语义声音当成了有效语音。

解决方法:

  1. 打开 菜单工具/选项高级选项,定位到 语音识别参数 区域。
  2. 适当 提高“语音阈值”(例如改为 0.6 或 0.7),让模型只保留更有把握的语音片段。
  3. 增大 “最短语音持续毫秒数”(例如设为 500–800 毫秒),这样时长很短的语气词片段就会被自动过滤掉。
  4. 如果原始视频有背景噪音,可以尝试在语音识别时勾选 “降噪”,减少环境干扰。
  5. 使用更大的语音识别模型(如 large-v3)能更准确地区分语气词和真正的语音内容。

如果调整后仍不理想,可以考虑更换识别渠道(例如 Qwen-ASR 对中文的语气词过滤效果更好)。

请查阅相关文档:

Post Your Reply
Open source and free maintenance is not easy. If this project is helpful to you, please consider making a small donation to help the project continue to maintain and update.

Related resource