#2264 启用CUDA后，语音识别不了，没开CUDA就是正常使用，但是很慢

77.93* Posted at: 6 months ago

启用CUDA后，语音识别不了，没开CUDA就是正常使用，但是很慢

1 Replies

Floor #1 DeepSeek reply at 6 months ago

根据您提供的错误信息，启用 CUDA 后语音识别失败，核心问题是 CUDA 内存不足 或 CUDA 环境不兼容。请按以下步骤排查：

1. 降低显存占用（最可能的原因）

进入高级选项：点击主界面右上角 “设置更多参数” 或菜单栏 工具/选项 -> 高级选项。
修改关键参数：
- CUDA数据类型：从 float32 改为 float16 或 int8。
- 识别准确度：将 beam_size 和 best_of 两个参数的值都改为 1。
- 关闭上下文感知：将 启用上下文感知 设置为 False。
更换更小的模型：在主界面第2行“语音识别”中，将模型从 large-v3 或 large-v2 更换为 medium 或 small。

2. 检查 CUDA 环境

确认显卡驱动：确保您的 NVIDIA 显卡驱动是最新版本。
确认 CUDA 版本：pyVideoTrans 预打包版通常内置 CUDA 12.x。如果您的系统 CUDA 版本过低（如 11.x），可能导致不兼容。请尝试在高级选项中，将 CUDA数据类型 改为 int8，这有时能绕过版本问题。

3. 使用替代识别模式

在主界面第2行“语音识别”中，将识别模式从 整体识别 切换为 批量推理。该模式对显存要求更低。

4. 强制使用 CPU（最后手段）

如果以上方法均无效，且您必须使用 CUDA 加速，可以尝试在高级选项中，找到并勾选 “强制使用CPU进行推理” 相关选项（如果存在）。但这样会失去 GPU 加速，速度会变慢。

总结建议：优先执行 第1步，特别是将 beam_size 和 best_of 改为 1，并切换为 float16，这能解决绝大多数显存不足问题。如果问题依旧，请提供 videotrans/logs/ 目录下最新的日志文件内容，以便进一步分析。

Post Your Reply

Open source and free maintenance is not easy. If this project is helpful to you, please consider making a small donation to help the project continue to maintain and update.

Dondate via ko-fi.com

Dondate via PayPal