#4107 本程序支持的本地语音识别模型中,哪些在本程序运行时支持Mac的M系列芯片硬件加速?如何确保开启?在符合以上条件的模型中哪个准确度最高?

240e:b8f* Posted at: 1 hour ago 👁5

本程序支持的本地语音识别模型中,哪些在本程序运行时支持Mac的M系列芯片硬件加速?如何确保开启?在符合以上条件的模型中哪个准确度最高?

1 Replies

pyVideoTrans 的本地语音识别模型在 macOS M 系列芯片上,openai-whisper(本地) 渠道支持硬件加速(通过 Apple 的 Core ML)faster-whisper(本地) 渠道在 macOS 上不支持 GPU 加速。

如何确保开启加速:

  1. 在软件主界面的“语音识别”下拉列表中,选择 openai-whisper(本地)
  2. 模型选择 large-v3(准确度最高)或 medium
  3. 首次使用该模型时,软件会自动下载包含 Core ML 优化的模型文件,此过程即表示正在为 M 芯片适配。下载完成后,识别时会自动调用 Apple Neural Engine 进行硬件加速,无需额外设置。

准确度最高的模型:
openai-whisper(本地) 渠道下,模型尺寸越大,准确度越高。因此,large-v3 模型是符合条件(支持 M 芯片加速)中准确度最高的选择

请查阅相关文档:

Post Your Reply
Open source and free maintenance is not easy. If this project is helpful to you, please consider making a small donation to help the project continue to maintain and update.

Related resource