#4153 英语语音识别,推荐用哪个渠道

2409:8a55* Posted at: 4 hours ago 👁12

英语语音识别,推荐用哪个渠道

1 Replies

英语语音识别推荐使用 faster-whisper(本地) 渠道,并选择 large-v3 模型。这是兼顾速度与准确度的最佳免费本地方案。

具体配置步骤如下:

  1. 在主界面“语音识别”下拉菜单中,选择 faster-whisper(本地)
  2. 在右侧模型选择中,选择 large-v3 模型(效果最好)。如果您的硬件资源有限,可降级选择 mediumsmall 模型。
  3. 确保“发音语言”已正确设置为 英语
  4. 如果您的电脑有 NVIDIA 显卡并已正确安装 CUDA 环境,请务必勾选主界面右上角的 CUDA加速,这将极大提升识别速度。

注意事项:

  • 如果视频是纯英语发音,也可以选择以 .en 结尾(如 large-v3-turbo.en)或 distil- 开头(如 distil-large-v3)的模型,它们专为英语优化,识别速度更快。
  • 首次使用某个模型时需要在线下载,请确保网络通畅或已配置代理。

请查阅相关文档:

Post Your Reply
Open source and free maintenance is not easy. If this project is helpful to you, please consider making a small donation to help the project continue to maintain and update.

Related resource