#4500 默认设置下,是否会使用vad作为whisper或faster whisper识别的前置处理过程?还是说必须开启 Whisper预分割音频 选项,才会使用silero?

103.3* Posted at: 2 hours ago 👁15

默认设置下,是否会使用vad作为whisper或faster whisper识别的前置处理过程?还是说必须开启 Whisper预分割音频 选项,才会使用silero?

3 Replies

默认设置下,软件会在语音识别前自动使用 silero VAD 对音频进行语音活动检测,无需额外开启。“Whisper预分割音频”是独立的选项,用于在 VAD 分割基础上进一步切分,以适配声音克隆等场景,默认未开启,可按需启用。

开启说话人识别pyannote。在不配音的情况下,会影响断句结果吗

开启说话人识别(pyannote)不会影响断句结果。断句由 VAD 和 Whisper 模型的语音活动检测参数控制,说话人分离仅在识别完成后为每条字幕附加说话人标签,不改变字幕的时间轴和文本分割。

Post Your Reply
Open source and free maintenance is not easy. If this project is helpful to you, please consider making a small donation to help the project continue to maintain and update.

Related resource