#138 使用faster-whisper（本地）语音识别英文，总是出现漏识别

2a09:bac1* Posted at: 10 months ago

使用faster-whisper（本地）语音识别英文，选择语音切割模式为整体识别，总是出现遗漏识别部分语音，我测试了large v1到v3-turbo的所有模型，也测试了distill版本的large模型，以及medium模型均有此问题。并且遗漏识别语音似乎是随机出现的，有的视频有遗漏，有的视频无遗漏。

通过更换语音切割模式为均等分割，遗漏识别现象消失，证明视频的音频质量不是导致遗漏识别的原因。但是由于均等分割的切割模式下，LLM重新断句不能使字幕按照实际的发音时间赋予时间戳，因而切换均等分割的切割模式无法满足实际使用需求。

请问这个问题如何解决？

5 Replies

Floor #1 2406:da18* reply at 10 months ago

无法确认原因

试试openai-whisper模式吧

Floor #2 2a12:f8c6* reply at 10 months ago

谢谢回复。我也发现使用openai-whisper模式可以避免漏识别现象。只是openai-whisper（本地）模式识别时间太长，即使选择medium模型，用时也是faster-whisper（本地）模式下large v3模型的15倍以上，让我难以忍受。

我已开启cuda加速，请问还有什么办法可以加快openai-whisper模式的识别速度吗？

Floor #3 146.235* reply at 10 months ago

Admin

没啥办法。faster-whisper就是针对 openai-whisper的加速版

Floor #4 2a12:f8c6* reply at 10 months ago

谢谢！

Floor #5 180.165* reply at 10 months ago

openai-whisper 的所有模型都会有遗漏，测出来large-v3 turbo遗漏稍微少一些，但还是有，这是什么原因？其他的语音识别模式有效果更好的吗？