#5173 语音识别时卡住????

240e:3a3* Posted at: 1 day ago

语音识别时卡住????

1 Replies

语音识别卡住通常是由于以下原因之一:

  1. 首次使用本地模型正在下载:若选择 faster-whisper(本地)openai-whisper(本地),第一次运行需要在线下载模型(如 large-v3 大小约 3 GB),下载过程可能因网络慢而长时间无响应。请打开 logs/ 目录下的最新日志文件,检查是否包含 Downloading model 字样。若确为下载中,请保持网络畅通等待完成,或手动下载模型放入 models/ 文件夹(参考手动下载faster-whisper模型)。
  2. 显存不足导致程序卡死large-v3 模型需至少 10 GB 显存(未使用 CUDA 时需 16 GB 以上内存)。若显存不足,任务管理器中 GPU 占用率极低且无输出。请切换为 smallbase 模型,并在高级选项中将 计算数据类型 改为 int8float16
  3. VAD 参数不合理:若 最长语音持续秒数最短语音持续毫秒 设置过大/过小,可能导致音频分割循环卡住。请进入 菜单→工具→高级选项→语音识别参数,恢复默认值(最长 15 秒,最短 1000 毫秒)。
  4. 在线 API 网络连接问题:若选择的是 OpenAI语音识别Gemini 等在线渠道,国内访问需配置有效的网络代理。请在主界面第 5 行 网络代理 处填写正确的代理地址(如 http://127.0.0.1:7890)。

若以上均不能解决,请提供 logs/ 目录下最新日志文件的后 30 行报错内容,以便进一步分析。

Post Your Reply
Open source and free maintenance is not easy. If this project is helpful to you, please consider making a small donation to help the project continue to maintain and update. Dondate: ko-fi.com/jianchang512

Related resource