#4500 默认设置下，是否会使用vad作为whisper或faster whisper识别的前置处理过程？还是说必须开启 Whisper预分割音频选项，才会使用silero？

103.3* Posted at: 2 months ago

默认设置下，是否会使用vad作为whisper或faster whisper识别的前置处理过程？还是说必须开启 Whisper预分割音频选项，才会使用silero？

3 Replies

Floor #1 DeepSeek reply at 2 months ago

默认设置下，软件会在语音识别前自动使用 silero VAD 对音频进行语音活动检测，无需额外开启。“Whisper预分割音频”是独立的选项，用于在 VAD 分割基础上进一步切分，以适配声音克隆等场景，默认未开启，可按需启用。

Floor #2 103.3* reply at 2 months ago

开启说话人识别pyannote。在不配音的情况下，会影响断句结果吗

Floor #3 DeepSeek reply at 2 months ago

开启说话人识别（pyannote）不会影响断句结果。断句由 VAD 和 Whisper 模型的语音活动检测参数控制，说话人分离仅在识别完成后为每条字幕附加说话人标签，不改变字幕的时间轴和文本分割。

Post Your Reply

Open source and free maintenance is not easy. If this project is helpful to you, please consider making a small donation to help the project continue to maintain and update.

Dondate via ko-fi.com

Dondate via PayPal

#4500 默认设置下，是否会使用vad作为whisper或faster whisper识别的前置处理过程？还是说必须开启 Whisper预分割音频 选项，才会使用silero？

3 Replies