#5419 语音识别阶段出错[WhisperX(本地API)] Error code: 500 - {'error': '处理过程中发生内部错误。'}Traceback (most recent call last):File "videotrans\

15.235* Posted at: 21 days ago

语音识别阶段出错[WhisperX(本地API)] Error code: 500 - {'error': '处理过程中发生内部错误。'}
Traceback (most recent call last):

File "videotrans\task\job.py", line 35, in run

File "videotrans\task\job.py", line 100, in process_task

File "videotrans\task\trans_create.py", line 319, in recogn

File "videotrans\recognition\__init__.py", line 191, in run

File "videotrans\recognition\_base.py", line 90, in run

File "videotrans\recognition\_whisperx.py", line 32, in _exec

File "openai\_utils\_utils.py", line 298, in wrapper

File "openai\resources\audio\transcriptions.py", line 485, in create

File "openai\_base_client.py", line 1332, in post

File "openai\_base_client.py", line 1105, in request

openai.InternalServerError: Error code: 500 - {'error': '处理过程中发生内部错误。'}
cfg=[TaskCfgVTT]当前工作模式: 转录并翻译字幕
原始输入文件名: G:/新建文件夹/zz/asuna_love.24.04.18_2.mp4,
输出结果保存到文件夹: G:/新建文件夹/zz/_video_out/asuna_love.24.04.18_2-mp4,
临时文件夹: D:/Tool/win-pyvideotrans-v4.03-0622/tmp/7924/570b74f920
已选清理已存在
已选启用CUDA加速
未选降噪
语音识别:WhisperX(本地API), model_name: distil-large-v3.5, 发音语言: 英语, 断句方式:LLM重新断句
翻译渠道:OpenAI ChatGPT,原始语言:英语,目标语言:简体中文, 已选发送完整字幕
已选将生成的字幕复制到视频目录下
输出字幕格式: 单字幕
代理地址:

=
system:Windows-10-10.0.26200-SP0
version:v4.03
frozen:True
language:zh
root_dir:D:/Tool/win-pyvideotrans-v4.03-0622

Floor #1 15.235* reply at 21 days ago

pp

Floor #2 DeepSeek reply at 21 days ago

WhisperX 本地服务返回了 HTTP 500 内部错误，表示服务在处理该音频文件时崩溃了，通常是由于显存不足、模型损坏或输入音频异常所致。

请按以下步骤排查：

检查 GPU 显存
distil-large-v3.5 模型需要至少 6-8 GB 显存。如果同时运行其他程序（或显存被其他进程占用），容易 OOM 导致服务崩溃。建议关闭其他 GPU 负载，或改用更小的模型（如 large-v3-turbo）。
确认 WhisperX 服务状态
打开 WhisperX 服务的控制台窗口，查看是否有崩溃堆栈输出。如果服务已停止，需要重启。
模型文件完整性
distil-large-v3.5 模型文件可能下载不完整。建议重新下载该模型（删除 models/ 下对应文件夹后重新运行让软件自动下载）。
临时关闭 LLM 重新断句
WhisperX 渠道不支持 LLM 重新断句功能，勾选此项可能导致冲突。请在高级选项中取消 LLM 重新断句，使用“默认断句”。
测试其他音频
换一个短小清晰的无背景音视频文件测试，排除原始音频编码或损坏问题。如果其他音频正常，说明原始文件可能包含特殊编码或损坏。
检查 API 地址
确保 WhisperX API 地址填写正确（默认 http://127.0.0.1:8000），不是 0.0.0.0。

如果以上均无效，请提供 WhisperX 服务端的控制台错误日志以便进一步分析。

请查阅相关文档：

Floor #3 DeepSeek reply at 21 days ago

WhisperX 返回 HTTP 500 表示其服务端在处理请求时发生了未捕获的异常，常见原因包括：服务未正常启动、模型文件损坏、显存不足、音频编码异常或配置不兼容（如 LLM 重新断句与 WhisperX 不兼容）。请按以下步骤排查：

确认 WhisperX 服务正常运行
打开 WhisperX 的控制台终端，查看是否有明显的错误堆栈（如 CUDA out of memory、Model not found 等）。若服务已崩溃则需要重启。API 地址默认应为 http://127.0.0.1:8000，不要填写 0.0.0.0。
临时关闭 LLM 重新断句
在高级选项中取消勾选“LLM 重新断句”，改用“默认断句”。WhisperX 渠道可能不支持 LLM 重新断句，开启后会导致异常。
检查模型与显存
distil-large-v3.5 需要至少 6-8 GB 显存。如果显存不足，请切换为 large-v3 或更小的模型（如 large-v3-turbo），并在高级选项中适当降低 beam_size、best_of。
验证音频文件
换一个短小、清晰、无背景噪音的视频测试，排除原始文件编码损坏或包含特殊声道的问题。
检查 GPU 驱动与 CUDA 版本
确保已安装 CUDA 12.8+ 和 cuDNN 9.11+，且环境变量正确配置。

如果以上步骤仍无法解决，请提供 WhisperX 服务端控制台输出的完整错误信息，以便进一步分析。

#5419 语音识别阶段出错[WhisperX(本地API)] Error code: 500 - {'error': '处理过程中发生内部错误。'}Traceback (most recent call last):File "videotrans\

3 Replies

请查阅相关文档：

请查阅相关文档：

Post Your Reply

Related resource