#5342 开启cuda加速后 卡在语音识别

2409:8a15* Posted at: 2 days ago

开启cuda加速后 卡在语音识别

日志最后显示 [DEBUG] faster-whisper模式下,对large-v3-turbo模型返回的字级时间戳进行断句

1 Replies

此类问题多由显存不足或CUDA环境异常导致。请按以下步骤排查:

  1. 确认显存是否足够large-v3-turbo 模型至少需要 6GB 以上空闲显存。打开任务管理器或 nvidia-smi 查看显卡占用,若显存接近满,请:

    • 关闭其他占用显存的程序。
    • 在主界面取消勾选 CUDA加速,先测试CPU模式是否正常通过语音识别(速度慢但可确认环境问题)。
    • 若CPU正常,则确认为显存不足,请改用 smallbase 模型,并进入 高级选项 -> 语音识别参数,将 计算数据类型 改为 int8beam_sizebest_of 调低至 1
  2. 验证CUDA/cuDNN安装:确保已安装 CUDA 12.8+ 和 cuDNN 9.11+,且 binlib 目录已添加到系统环境变量 Path。在命令行执行 nvcc -Vnvidia-smi 确认识别正确。
  3. 检查模型完整性:手动检查 models 目录下 models--mobiuslabsgmbh--faster-whisper-large-v3-turbo 文件夹是否存在且包含所有 .bin.json.txt 文件。若缺少,可手动下载覆盖(参考知识库第14节)。
  4. 日志完整排查:请提供软件目录 logs/ 文件夹下最新的日志文件完整内容(包含更早的报错行),以便进一步定位。

请查阅相关文档:

Post Your Reply
Open source and free maintenance is not easy. If this project is helpful to you, please consider making a small donation to help the project continue to maintain and update. Dondate: ko-fi.com/jianchang512

Related resource