#5419 语音识别阶段出错[WhisperX(本地API)] Error code: 500 - {'error': '处理过程中发生内部错误。'}Traceback (most recent call last):File "videotrans\

15.235* Posted at: 12 hours ago

语音识别阶段出错[WhisperX(本地API)] Error code: 500 - {'error': '处理过程中发生内部错误。'}
Traceback (most recent call last):

File "videotrans\task\job.py", line 35, in run

File "videotrans\task\job.py", line 100, in process_task

File "videotrans\task\trans_create.py", line 319, in recogn

File "videotrans\recognition\__init__.py", line 191, in run

File "videotrans\recognition\_base.py", line 90, in run

File "videotrans\recognition\_whisperx.py", line 32, in _exec

File "openai\_utils\_utils.py", line 298, in wrapper

File "openai\resources\audio\transcriptions.py", line 485, in create

File "openai\_base_client.py", line 1332, in post

File "openai\_base_client.py", line 1105, in request

openai.InternalServerError: Error code: 500 - {'error': '处理过程中发生内部错误。'}
cfg=[TaskCfgVTT]当前工作模式: 转录并翻译字幕
原始输入文件名: G:/新建文件夹/zz/asuna_love.24.04.18_2.mp4,
输出结果保存到文件夹: G:/新建文件夹/zz/_video_out/asuna_love.24.04.18_2-mp4,
临时文件夹: D:/Tool/win-pyvideotrans-v4.03-0622/tmp/7924/570b74f920
已选 清理已存在
已选 启用CUDA加速
未选 降噪
语音识别:WhisperX(本地API), model_name: distil-large-v3.5, 发音语言: 英语, 断句方式:LLM重新断句
翻译渠道:OpenAI ChatGPT,原始语言:英语,目标语言:简体中文, 已选 发送完整字幕
已选 将生成的字幕复制到视频目录下
输出字幕格式: 单字幕
代理地址:


=
system:Windows-10-10.0.26200-SP0
version:v4.03
frozen:True
language:zh
root_dir:D:/Tool/win-pyvideotrans-v4.03-0622

3 Replies

pp

WhisperX 本地服务返回了 HTTP 500 内部错误,表示服务在处理该音频文件时崩溃了,通常是由于显存不足、模型损坏或输入音频异常所致。

请按以下步骤排查:

  1. 检查 GPU 显存
    distil-large-v3.5 模型需要至少 6-8 GB 显存。如果同时运行其他程序(或显存被其他进程占用),容易 OOM 导致服务崩溃。建议关闭其他 GPU 负载,或改用更小的模型(如 large-v3-turbo)。
  2. 确认 WhisperX 服务状态
    打开 WhisperX 服务的控制台窗口,查看是否有崩溃堆栈输出。如果服务已停止,需要重启。
  3. 模型文件完整性
    distil-large-v3.5 模型文件可能下载不完整。建议重新下载该模型(删除 models/ 下对应文件夹后重新运行让软件自动下载)。
  4. 临时关闭 LLM 重新断句
    WhisperX 渠道不支持 LLM 重新断句功能,勾选此项可能导致冲突。请在高级选项中取消 LLM 重新断句,使用“默认断句”。
  5. 测试其他音频
    换一个短小清晰的无背景音视频文件测试,排除原始音频编码或损坏问题。如果其他音频正常,说明原始文件可能包含特殊编码或损坏。
  6. 检查 API 地址
    确保 WhisperX API 地址填写正确(默认 http://127.0.0.1:8000),不是 0.0.0.0。

如果以上均无效,请提供 WhisperX 服务端的控制台错误日志以便进一步分析。

请查阅相关文档:

WhisperX 返回 HTTP 500 表示其服务端在处理请求时发生了未捕获的异常,常见原因包括:服务未正常启动、模型文件损坏、显存不足、音频编码异常或配置不兼容(如 LLM 重新断句与 WhisperX 不兼容)。请按以下步骤排查:

  1. 确认 WhisperX 服务正常运行
    打开 WhisperX 的控制台终端,查看是否有明显的错误堆栈(如 CUDA out of memoryModel not found 等)。若服务已崩溃则需要重启。API 地址默认应为 http://127.0.0.1:8000,不要填写 0.0.0.0
  2. 临时关闭 LLM 重新断句
    在高级选项中取消勾选“LLM 重新断句”,改用“默认断句”。WhisperX 渠道可能不支持 LLM 重新断句,开启后会导致异常。
  3. 检查模型与显存
    distil-large-v3.5 需要至少 6-8 GB 显存。如果显存不足,请切换为 large-v3 或更小的模型(如 large-v3-turbo),并在高级选项中适当降低 beam_sizebest_of
  4. 验证音频文件
    换一个短小、清晰、无背景噪音的视频测试,排除原始文件编码损坏或包含特殊声道的问题。
  5. 检查 GPU 驱动与 CUDA 版本
    确保已安装 CUDA 12.8+ 和 cuDNN 9.11+,且环境变量正确配置。

如果以上步骤仍无法解决,请提供 WhisperX 服务端控制台输出的完整错误信息,以便进一步分析。

请查阅相关文档:

Post Your Reply
Open source and free maintenance is not easy. If this project is helpful to you, please consider making a small donation to help the project continue to maintain and update. Dondate: ko-fi.com/jianchang512

Related resource

Similar issues already exist