#5174 faster-whisper语音识别时卡住

240e:3a3* Posted at: 1 day ago

faster-whisper语音识别时卡住

1 Replies

faster-whisper 卡住通常由模型首次下载阻塞、显存不足或 CUDA 环境未正确配置导致进程挂起。

解决方法:

  1. 首次运行模型下载:首次使用会自动下载模型(约 2~3GB),若网络不稳定或无法连通 Hugging Face 会导致长时间无响应。建议手动下载模型并放置到 models/ 目录,具体方法见下方文档。
  2. 显存不足:large-v3 模型需至少 8GB 显存。请尝试:

    • 切换为 smallbase 模型。
    • 高级选项 → 语音识别参数 中将「计算数据类型」改为 float16int8,将 beam_sizebest_of 改为 1
    • 关闭「启用上下文感知」。
  3. CUDA 环境问题:确保正确安装 CUDA 12.8+ 和 cuDNN 9.11+,并检查系统环境变量包含 CUDA 的 binlib 目录。可在 CMD 运行 nvcc -Vnvidia-smi 验证。
  4. 重启软件:若仍卡死,强制结束进程后重新打开软件,避免多任务并发导致资源锁定。

如果以上均无效,请提供 logs/ 目录下最新日志文件的后 30 行,以便进一步分析。

请查阅相关文档:

Post Your Reply
Open source and free maintenance is not easy. If this project is helpful to you, please consider making a small donation to help the project continue to maintain and update. Dondate: ko-fi.com/jianchang512

Related resource