#5512 语音识别阶段出错[WhisperX(本地API)] Error code: 500 - {'error': '处理过程中发生内部错误。'}Traceback (most recent call last):File "videotrans\

15.235* Posted at: 1 hour ago

语音识别阶段出错[WhisperX(本地API)] Error code: 500 - {'error': '处理过程中发生内部错误。'}
Traceback (most recent call last):

File "videotrans\task\job.py", line 35, in run

File "videotrans\task\job.py", line 100, in process_task

File "videotrans\task\trans_create.py", line 319, in recogn

File "videotrans\recognition\__init__.py", line 191, in run

File "videotrans\recognition\_base.py", line 90, in run

File "videotrans\recognition\_whisperx.py", line 32, in _exec

File "openai\_utils\_utils.py", line 298, in wrapper

File "openai\resources\audio\transcriptions.py", line 485, in create

File "openai\_base_client.py", line 1332, in post

File "openai\_base_client.py", line 1105, in request

openai.InternalServerError: Error code: 500 - {'error': '处理过程中发生内部错误。'}
cfg=[TaskCfgVTT]当前工作模式: 转录并翻译字幕
原始输入文件名: G:/新建文件夹/1/cc/1080P_4000K_115306181.mp4,
输出结果保存到文件夹: G:/新建文件夹/1/cc/_video_out/1080P_4000K_115306181-mp4,
临时文件夹: D:/Tool/win-pyvideotrans-v4.03-0622/tmp/3620/c9378e4a9b
已选 清理已存在
已选 启用CUDA加速
未选 降噪
语音识别:WhisperX(本地API), model_name: distil-large-v3.5, 发音语言: 英语, 断句方式:默认断句
翻译渠道:Google(免费),原始语言:英语,目标语言:简体中文, 已选 发送完整字幕
已选 将生成的字幕复制到视频目录下
输出字幕格式: 单字幕
代理地址:


=
system:Windows-10-10.0.26200-SP0
version:v4.03
frozen:True
language:zh
root_dir:D:/Tool/win-pyvideotrans-v4.03-0622

3 Replies

okm

WhisperX 服务返回 500 内部错误,说明请求已到达您的 WhisperX 服务端,但服务器在处理时自身崩溃或异常。

根本原因:WhisperX 服务端未正确配置(模型加载失败、CUDA 显存不足、依赖缺失)或请求的音频格式不兼容。


解决方案

  1. 检查 WhisperX 服务状态
    访问其 API 地址(默认 http://127.0.0.1:9900),确认服务是否在运行。在浏览器打开 http://127.0.0.1:9900/health 或直接发送一个测试请求看返回。
  2. 查看 WhisperX 控制台日志
    启动 WhisperX 的终端/命令行窗口,找到具体的错误堆栈(通常是显存溢出或模型下载失败)。

    • 若报错 CUDA out of memory,请换用更小的模型(如 basesmall)或关闭 CUDA 加速。
    • 若报错 Model not found,请手动下载 distil-large-v3.5 模型放到指定目录。
  3. 确认音频文件可正常读取
    用其他播放器打开视频,确保音轨正常。长路径或中文文件名也可能触发处理异常,建议将视频移到简单路径(如 D:/test.mp4)重试。
  4. 临时切换其他识别渠道
    绕过该问题,改用 faster-whisper(本地) + large-v3 模型,下次再排查 WhisperX 部署细节。

请查阅相关文档:

WhisperX 服务返回 500 内部错误,说明请求已到达您的 WhisperX 服务端,但服务器在处理时自身崩溃或异常。根本原因:WhisperX 服务端未正确配置(模型加载失败、CUDA 显存不足、依赖缺失)或请求的音频格式不兼容。

解决方案:

  1. 检查 WhisperX 服务状态:访问其 API 地址(默认 http://127.0.0.1:9900),在浏览器打开 /health 路径或直接发送一个测试请求,确认服务是否正常运行。
  2. 查看 WhisperX 控制台日志:启动 WhisperX 的终端/命令行窗口中会打印具体错误堆栈(通常是显存溢出或模型下载失败)。

    • 若报错 CUDA out of memory,请换用更小的模型(如 basesmall)或关闭 CUDA 加速。
    • 若报错 Model not found,请手动下载 distil-large-v3.5 模型并放到 WhisperX 指定目录。
  3. 确认音频文件可正常读取:用其他播放器播放视频确保音轨正常。长路径或中文文件名也可能触发异常,建议将视频移到简单路径(如 D:/test.mp4)重试。
  4. 临时切换其他识别渠道:绕过该问题,改用 faster-whisper(本地) + large-v3 模型,下次再排查 WhisperX 部署细节。

请查阅相关文档:

Post Your Reply
Open source and free maintenance is not easy. If this project is helpful to you, please consider making a small donation to help the project continue to maintain and update. Dondate: ko-fi.com/jianchang512

Related resource