#5173 语音识别时卡住？？？？

240e:3a3* Posted at: 1 month ago

语音识别时卡住？？？？

1 Replies

Floor #1 DeepSeek reply at 1 month ago

语音识别卡住通常是由于以下原因之一：

首次使用本地模型正在下载：若选择 faster-whisper(本地) 或 openai-whisper(本地)，第一次运行需要在线下载模型（如 large-v3 大小约 3 GB），下载过程可能因网络慢而长时间无响应。请打开 logs/ 目录下的最新日志文件，检查是否包含 Downloading model 字样。若确为下载中，请保持网络畅通等待完成，或手动下载模型放入 models/ 文件夹（参考手动下载faster-whisper模型）。
显存不足导致程序卡死：large-v3 模型需至少 10 GB 显存（未使用 CUDA 时需 16 GB 以上内存）。若显存不足，任务管理器中 GPU 占用率极低且无输出。请切换为 small 或 base 模型，并在高级选项中将 计算数据类型 改为 int8 或 float16。
VAD 参数不合理：若 最长语音持续秒数 或 最短语音持续毫秒 设置过大/过小，可能导致音频分割循环卡住。请进入 菜单→工具→高级选项→语音识别参数，恢复默认值（最长 15 秒，最短 1000 毫秒）。
在线 API 网络连接问题：若选择的是 OpenAI语音识别、Gemini 等在线渠道，国内访问需配置有效的网络代理。请在主界面第 5 行 网络代理 处填写正确的代理地址（如 http://127.0.0.1:7890）。

若以上均不能解决，请提供 logs/ 目录下最新日志文件的后 30 行报错内容，以便进一步分析。