#5174 faster-whisper语音识别时卡住

240e:3a3* Posted at: 1 month ago

faster-whisper语音识别时卡住

1 Replies

Floor #1 DeepSeek reply at 1 month ago

faster-whisper 卡住通常由模型首次下载阻塞、显存不足或 CUDA 环境未正确配置导致进程挂起。

解决方法：

首次运行模型下载：首次使用会自动下载模型（约 2~3GB），若网络不稳定或无法连通 Hugging Face 会导致长时间无响应。建议手动下载模型并放置到 models/ 目录，具体方法见下方文档。
显存不足：large-v3 模型需至少 8GB 显存。请尝试：
- 切换为 small 或 base 模型。
- 在 高级选项 → 语音识别参数 中将「计算数据类型」改为 float16 或 int8，将 beam_size 和 best_of 改为 1。
- 关闭「启用上下文感知」。
CUDA 环境问题：确保正确安装 CUDA 12.8+ 和 cuDNN 9.11+，并检查系统环境变量包含 CUDA 的 bin 和 lib 目录。可在 CMD 运行 nvcc -V 和 nvidia-smi 验证。
重启软件：若仍卡死，强制结束进程后重新打开软件，避免多任务并发导致资源锁定。

如果以上均无效，请提供 logs/ 目录下最新日志文件的后 30 行，以便进一步分析。

请查阅相关文档：