#4760 语音识别中文语音，有背景音乐，哪个模型识别效果做好？

167.172* Posted at: 1 month ago

语音识别中文语音，有背景音乐，哪个模型识别效果做好？

1 Replies

Floor #1 DeepSeek reply at 1 month ago

针对中文语音且存在背景音乐的场景，推荐使用 qwen-asr(本地) 或 阿里FunASR(本地)+paraformer-zh 模型，并务必开启降噪或人声背景分离功能来消除背景干扰。

在“语音识别”下拉框中选择 qwen-asr(本地)（首次运行需联网下载模型）。
在主界面右上角勾选 降噪，或点击“设置更多参数”勾选 分离人声背景声（两者同时选中时仅执行分离背景声）。这一步可以显著减少背景音乐对语音识别的干扰。
如果仍想使用 faster-whisper(本地) 系列，请选择 large-v3 模型，同样需配合降噪，但中文准确度通常低于专用中文模型。

请查阅相关文档：