#5512 语音识别阶段出错[WhisperX(本地API)] Error code: 500 - {'error': '处理过程中发生内部错误。'}Traceback (most recent call last):File "videotrans\

15.235* Posted at: 20 days ago

语音识别阶段出错[WhisperX(本地API)] Error code: 500 - {'error': '处理过程中发生内部错误。'}
Traceback (most recent call last):

File "videotrans\task\job.py", line 35, in run

File "videotrans\task\job.py", line 100, in process_task

File "videotrans\task\trans_create.py", line 319, in recogn

File "videotrans\recognition\__init__.py", line 191, in run

File "videotrans\recognition\_base.py", line 90, in run

File "videotrans\recognition\_whisperx.py", line 32, in _exec

File "openai\_utils\_utils.py", line 298, in wrapper

File "openai\resources\audio\transcriptions.py", line 485, in create

File "openai\_base_client.py", line 1332, in post

File "openai\_base_client.py", line 1105, in request

openai.InternalServerError: Error code: 500 - {'error': '处理过程中发生内部错误。'}
cfg=[TaskCfgVTT]当前工作模式: 转录并翻译字幕
原始输入文件名: G:/新建文件夹/1/cc/1080P_4000K_115306181.mp4,
输出结果保存到文件夹: G:/新建文件夹/1/cc/_video_out/1080P_4000K_115306181-mp4,
临时文件夹: D:/Tool/win-pyvideotrans-v4.03-0622/tmp/3620/c9378e4a9b
已选清理已存在
已选启用CUDA加速
未选降噪
语音识别:WhisperX(本地API), model_name: distil-large-v3.5, 发音语言: 英语, 断句方式:默认断句
翻译渠道:Google(免费),原始语言:英语,目标语言:简体中文, 已选发送完整字幕
已选将生成的字幕复制到视频目录下
输出字幕格式: 单字幕
代理地址:

=
system:Windows-10-10.0.26200-SP0
version:v4.03
frozen:True
language:zh
root_dir:D:/Tool/win-pyvideotrans-v4.03-0622

3 Replies

Floor #1 15.235* reply at 20 days ago

okm

Floor #2 DeepSeek reply at 20 days ago

WhisperX 服务返回 500 内部错误，说明请求已到达您的 WhisperX 服务端，但服务器在处理时自身崩溃或异常。

根本原因：WhisperX 服务端未正确配置（模型加载失败、CUDA 显存不足、依赖缺失）或请求的音频格式不兼容。

解决方案

检查 WhisperX 服务状态
访问其 API 地址（默认 http://127.0.0.1:9900），确认服务是否在运行。在浏览器打开 http://127.0.0.1:9900/health 或直接发送一个测试请求看返回。
查看 WhisperX 控制台日志
启动 WhisperX 的终端/命令行窗口，找到具体的错误堆栈（通常是显存溢出或模型下载失败）。
- 若报错 CUDA out of memory，请换用更小的模型（如 base 或 small）或关闭 CUDA 加速。
- 若报错 Model not found，请手动下载 distil-large-v3.5 模型放到指定目录。
确认音频文件可正常读取
用其他播放器打开视频，确保音轨正常。长路径或中文文件名也可能触发处理异常，建议将视频移到简单路径（如 D:/test.mp4）重试。
临时切换其他识别渠道
绕过该问题，改用 faster-whisper(本地) + large-v3 模型，下次再排查 WhisperX 部署细节。

请查阅相关文档：

WhisperX 渠道部署说明

Floor #3 DeepSeek reply at 20 days ago

WhisperX 服务返回 500 内部错误，说明请求已到达您的 WhisperX 服务端，但服务器在处理时自身崩溃或异常。根本原因：WhisperX 服务端未正确配置（模型加载失败、CUDA 显存不足、依赖缺失）或请求的音频格式不兼容。

解决方案：

检查 WhisperX 服务状态：访问其 API 地址（默认 http://127.0.0.1:9900），在浏览器打开 /health 路径或直接发送一个测试请求，确认服务是否正常运行。
查看 WhisperX 控制台日志：启动 WhisperX 的终端/命令行窗口中会打印具体错误堆栈（通常是显存溢出或模型下载失败）。
- 若报错 CUDA out of memory，请换用更小的模型（如 base 或 small）或关闭 CUDA 加速。
- 若报错 Model not found，请手动下载 distil-large-v3.5 模型并放到 WhisperX 指定目录。
确认音频文件可正常读取：用其他播放器播放视频确保音轨正常。长路径或中文文件名也可能触发异常，建议将视频移到简单路径（如 D:/test.mp4）重试。
临时切换其他识别渠道：绕过该问题，改用 faster-whisper(本地) + large-v3 模型，下次再排查 WhisperX 部署细节。

请查阅相关文档：

WhisperX 渠道部署说明