#4760 语音识别中文语音,有背景音乐,哪个模型识别效果做好?

167.172* Posted at: 9 hours ago

语音识别中文语音,有背景音乐,哪个模型识别效果做好?

1 Replies

针对中文语音且存在背景音乐的场景,推荐使用 qwen-asr(本地)阿里FunASR(本地)+paraformer-zh 模型,并务必开启降噪或人声背景分离功能来消除背景干扰。

  1. 在“语音识别”下拉框中选择 qwen-asr(本地)(首次运行需联网下载模型)。
  2. 在主界面右上角勾选 降噪,或点击“设置更多参数”勾选 分离人声背景声(两者同时选中时仅执行分离背景声)。这一步可以显著减少背景音乐对语音识别的干扰。
  3. 如果仍想使用 faster-whisper(本地) 系列,请选择 large-v3 模型,同样需配合降噪,但中文准确度通常低于专用中文模型。

请查阅相关文档:

Post Your Reply
Open source and free maintenance is not easy. If this project is helpful to you, please consider making a small donation to help the project continue to maintain and update.

Related resource