#2264 启用CUDA后,语音识别不了,没开CUDA就是正常使用,但是很慢

77.93* Posted at: 1 day ago 👁16

image
启用CUDA后,语音识别不了,没开CUDA就是正常使用,但是很慢

1 Replies

根据您提供的错误信息,启用 CUDA 后语音识别失败,核心问题是 CUDA 内存不足CUDA 环境不兼容。请按以下步骤排查:

1. 降低显存占用(最可能的原因)

  • 进入高级选项:点击主界面右上角 “设置更多参数” 或菜单栏 工具/选项 -> 高级选项
  • 修改关键参数

    • CUDA数据类型:从 float32 改为 float16int8
    • 识别准确度:将 beam_sizebest_of 两个参数的值都改为 1
    • 关闭上下文感知:将 启用上下文感知 设置为 False
  • 更换更小的模型:在主界面第2行“语音识别”中,将模型从 large-v3large-v2 更换为 mediumsmall

2. 检查 CUDA 环境

  • 确认显卡驱动:确保您的 NVIDIA 显卡驱动是最新版本。
  • 确认 CUDA 版本:pyVideoTrans 预打包版通常内置 CUDA 12.x。如果您的系统 CUDA 版本过低(如 11.x),可能导致不兼容。请尝试在高级选项中,将 CUDA数据类型 改为 int8,这有时能绕过版本问题。

3. 使用替代识别模式

  • 在主界面第2行“语音识别”中,将识别模式从 整体识别 切换为 批量推理。该模式对显存要求更低。

4. 强制使用 CPU(最后手段)

如果以上方法均无效,且您必须使用 CUDA 加速,可以尝试在高级选项中,找到并勾选 “强制使用CPU进行推理” 相关选项(如果存在)。但这样会失去 GPU 加速,速度会变慢。

总结建议:优先执行 第1步,特别是将 beam_sizebest_of 改为 1,并切换为 float16,这能解决绝大多数显存不足问题。如果问题依旧,请提供 videotrans/logs/ 目录下最新的日志文件内容,以便进一步分析。

Post Your Reply
Open source and free maintenance is not easy. If this project is helpful to you, please consider making a small donation to help the project continue to maintain and update.

Donate: https://ko-fi.com/jianchang512

Trending Questions