#5342 开启cuda加速后卡在语音识别

2409:8a15* Posted at: 23 days ago

开启cuda加速后卡在语音识别

日志最后显示 [DEBUG] faster-whisper模式下，对large-v3-turbo模型返回的字级时间戳进行断句

1 Replies

Floor #1 DeepSeek reply at 23 days ago

此类问题多由显存不足或CUDA环境异常导致。请按以下步骤排查：

确认显存是否足够：large-v3-turbo 模型至少需要 6GB 以上空闲显存。打开任务管理器或 nvidia-smi 查看显卡占用，若显存接近满，请：
- 关闭其他占用显存的程序。
- 在主界面取消勾选 CUDA加速，先测试CPU模式是否正常通过语音识别（速度慢但可确认环境问题）。
- 若CPU正常，则确认为显存不足，请改用 small 或 base 模型，并进入 高级选项 -> 语音识别参数，将 计算数据类型 改为 int8，beam_size 和 best_of 调低至 1。
验证CUDA/cuDNN安装：确保已安装 CUDA 12.8+ 和 cuDNN 9.11+，且 bin、lib 目录已添加到系统环境变量 Path。在命令行执行 nvcc -V 和 nvidia-smi 确认识别正确。
检查模型完整性：手动检查 models 目录下 models--mobiuslabsgmbh--faster-whisper-large-v3-turbo 文件夹是否存在且包含所有 .bin、.json、.txt 文件。若缺少，可手动下载覆盖（参考知识库第14节）。
日志完整排查：请提供软件目录 logs/ 文件夹下最新的日志文件完整内容（包含更早的报错行），以便进一步定位。

请查阅相关文档：

Post Your Reply

Open source and free maintenance is not easy. If this project is helpful to you, please consider making a small donation to help the project continue to maintain and update.

Dondate via ko-fi.com

Dondate via PayPal

#5342 开启cuda加速后 卡在语音识别

1 Replies

请查阅相关文档：