#2301 使用 WhisperX进行语音识别的时候，会失败并有一下错误，顺便一提设置页面测试的时候没问题

2401:b60* Posted at: 2 months ago 👁173

语音识别阶段出错:[WhisperX] 网络连接失败:
Traceback (most recent call last):
File "httpx\_transports\default.py", line 101, in map_httpcore_exceptions
File "httpx\_transports\default.py", line 250, in handle_request
File "httpcore\_sync\connection_pool.py", line 216, in handle_request
File "httpcore\_sync\connection_pool.py", line 196, in handle_request
File "httpcore\_sync\connection.py", line 99, in handle_request
File "httpcore\_sync\connection.py", line 76, in handle_request
File "httpcore\_sync\connection.py", line 122, in _connect
File "httpcore\_backends\sync.py", line 205, in connect_tcp
File "contextlib.py", line 153, in exit
File "httpcore\_exceptions.py", line 14, in map_exceptions
httpcore.ConnectError: [WinError 10061] 由于目标计算机积极拒绝，无法连接。

The above exception was the direct cause of the following exception:

Traceback (most recent call last):
File "openai\_base_client.py", line 982, in request
File "httpx\_client.py", line 914, in send
File "httpx\_client.py", line 942, in _send_handling_auth
File "httpx\_client.py", line 979, in _send_handling_redirects
File "httpx\_client.py", line 1014, in _send_single_request
File "httpx\_transports\default.py", line 249, in handle_request
File "contextlib.py", line 153, in exit
File "httpx\_transports\default.py", line 118, in map_httpcore_exceptions
httpx.ConnectError: [WinError 10061] 由于目标计算机积极拒绝，无法连接。

The above exception was the direct cause of the following exception:

Traceback (most recent call last):
File "videotrans\task\job.py", line 113, in run
File "videotrans\task\trans_create.py", line 365, in recogn
File "videotrans\recognition\__init__.py", line 222, in run
File "videotrans\recognition\_base.py", line 80, in run
File "videotrans\recognition\_whisperx.py", line 46, in _exec
File "openai\_utils\_utils.py", line 286, in wrapper
File "openai\resources\audio\transcriptions.py", line 406, in create
File "openai\_base_client.py", line 1259, in post
File "openai\_base_client.py", line 1014, in request
openai.APIConnectionError: Connection error.

TaskCfg(cache_folder='E:/AI/【视频语音互相转】win-pyvideotrans-3.90/tmp/15928/8d034176d4', target_dir='D:/下载/_video_out/index_01-wav', remove_noise=False, is_separate=False, detect_language='zh-cn', subtitle_language=None, source_language='简体中文', target_language='简体中文', source_language_code='zh-cn', target_language_code='zh-cn', source_sub='D:/下载/_video_out/index_01-wav/zh-cn.srt', target_sub='D:/下载/_video_out/index_01-wav/zh-cn.srt', source_wav='E:/AI/【视频语音互相转】win-pyvideotrans-3.90/tmp/15928/8d034176d4/zh-cn.wav', source_wav_output='D:/下载/_video_out/index_01-wav/zh-cn.m4a', target_wav='E:/AI/【视频语音互相转】win-pyvideotrans-3.90/tmp/15928/8d034176d4/target.wav', target_wav_output='D:/下载/_video_out/index_01-wav/zh-cn.m4a', subtitles='', novoice_mp4='E:/AI/【视频语音互相转】win-pyvideotrans-3.90/tmp/15928/8d034176d4/novoice.mp4', noextname='index_01', shibie_audio=None, targetdir_mp4='D:/下载/_video_out/index_01-wav/index_01.mp4', instrument=None, vocal=None, back_audio='', background_music=None, app_mode='tiqu', subtitle_type=0, volume='+0%', pitch='+0Hz', voice_rate='+0%', voice_role='No', copysrt_rawvideo=True, clear_cache=True, translate_type=0, tts_type=0, recogn_type=17, model_name='large-v3-turbo', split_type=0, voice_autorate=False, video_autorate=False, cuda=True, name='D:/下载/index_01.wav', basename='index_01.wav', ext='wav', dirname='D:/下载', shound_del_name=None, uuid='8d034176d4', remove_silent_mid=True, align_sub_audio=True, enable_diariz=False, nums_diariz=0, rephrase=1, only_out_mp4=False)

Floor #1 DeepSeek AI reply at 2 months ago

错误信息显示 由于目标计算机积极拒绝，无法连接，这表明 WhisperX 在尝试连接其 API 服务器时被拒绝。虽然设置页面测试正常，但实际处理时连接失败，可能原因及解决方法如下：

网络代理问题：WhisperX 使用的是 OpenAI 的 API 接口。请检查您是否在软件中正确配置了网络代理。
- 在软件主界面第5行找到“网络代理”输入框。
- 填入可用的代理地址，格式如 http://127.0.0.1:你的代理端口。
- 如果已填写，请尝试更换为其他可用的代理节点。
API 密钥或基础URL配置错误：请确认 WhisperX 渠道的配置。
- 进入菜单栏 设置/配置 -> 语音识别 选项卡。
- 找到并点击 WhisperX 渠道的“配置”按钮。
- 检查 API Key 和 Base URL 是否正确。Base URL 通常应为 https://api.openai.com/v1，除非您使用第三方代理。
- 如果使用第三方代理服务，请确保 Base URL 填写的是该服务提供的正确地址。
临时性网络波动或服务限制：OpenAI 的 API 服务可能出现临时性问题或对您的 IP/账户进行了速率限制。
- 稍等几分钟后重试任务。
- 如果您使用的是共享或免费 API 密钥，可能已达到调用限制，请更换密钥或等待限制解除。
防火墙/安全软件拦截：部分防火墙或安全软件可能阻止了软件的非浏览器网络连接。
- 暂时禁用防火墙或安全软件后重试（操作前请评估风险）。
- 在防火墙设置中为 pyVideoTrans 或 sp.exe 添加出站规则例外。

如果以上方法均无效，请提供 videotrans/logs/ 目录下最新的日志文件，以便进一步分析具体的请求地址和错误详情。

有用的文档链接: OpenAI语音识别API

Floor #2 2401:b60* reply at 2 months ago

[2025-12-26 17:26:45] PS E:\AI\whisperx-api> uv run app.py
E:\AI\whisperx-api.venv\lib\site-packages\pyannote\audio\core\io.py:212: UserWarning: torchaudio._backend.list_audio_backends has been deprecated. This deprecation is part of a large refactoring effort to transition TorchAudio into a maintenance phase. The decoding and encoding capabilities of PyTorch for both audio and video are being consolidated into TorchCodec. Please see https://github.com/pytorch/audio/issues/3902 for more information. It will be removed from the 2.9 release.
torchaudio.list_audio_backends()
2025-12-26 17:26:54,312 - INFO - 成功从 token.txt 文件中读取 Hugging Face 令牌。
2025-12-26 17:26:54,313 - INFO - 使用设备: cpu，计算类型: int8
2025-12-26 17:26:54,321 - INFO - FFmpeg 环境检查通过。
2025-12-26 17:26:54,322 - INFO - 服务已启动，正在监听 http://127.0.0.1:9092
2025-12-26 17:26:54,324 - INFO - Serving on http://127.0.0.1:9092
ImmutableMultiDict([('model', 'tiny'), ('language', 'zh'), ('response_format', 'diarized_json'), ('max_speakers', '-1')])
2025-12-26 17:31:02,476 - INFO - 收到请求: 模型='tiny', 语言='zh', 提示词='无'
2025-12-26 17:31:02,479 - INFO - 正在将上传的文件 'E:/AI/【视频语音互相转】win-pyvideotrans-3.90/videotrans/styles/no-remove.wav' 转换为标准的 16kHz 单声道 WAV 格式...
2025-12-26 17:31:02,510 - INFO - 文件格式转换成功。
2025-12-26 17:31:02,534 - INFO - 正在加载 Whisper 模型 'tiny'...
E:\AI\whisperx-api.venv\lib\site-packages\ctranslate2\__init__.py:8: UserWarning: pkg_resources is deprecated as an API. See https://setuptools.pypa.io/en/latest/pkg_resources.html. The pkg_resources package is slated for removal as early as 2025-11-30. Refrain from using this package or pin to Setuptools

Floor #3 DeepSeek AI reply at 2 months ago

您正在使用本地部署的 WhisperX API 服务，并且日志显示服务已成功启动在 http://127.0.0.1:9092。然而，pyVideoTrans 在连接时出现了“目标计算机积极拒绝”的错误。

核心原因与解决方案：

这通常是因为 pyVideoTrans 中配置的 WhisperX API 地址与您实际运行的本地服务地址不匹配。

请按以下步骤检查和修正：

在 pyVideoTrans 中检查并配置 WhisperX 的 API 地址：
- 打开 pyVideoTrans。
- 点击菜单栏的 设置/配置。
- 切换到 语音识别 选项卡。
- 在渠道列表中找到 WhisperX，点击其右侧的配置按钮。
- 在弹出的配置窗口中，找到 Base URL 或 API 地址 的输入框。
- 将其修改为您本地服务运行的地址，即 http://127.0.0.1:9092。
- 确保 API Key 字段留空或填写一个任意字符（如果您的本地服务不需要密钥）。
- 点击测试按钮，应该会返回连接成功的提示。
确认本地服务运行正常：
- 您的日志显示服务已在 http://127.0.0.1:9092 监听，这是正确的。请确保在 pyVideoTrans 进行测试和任务运行时，这个命令行窗口保持打开状态。
在 pyVideoTrans 主界面选择正确的识别渠道：
- 完成上述配置后，在主界面第2行的“语音识别”下拉菜单中，务必选择 “WhisperX”，而不是其他选项（如 faster-whisper 或 OpenAI-Whisper）。

完成以上设置后，再次尝试运行任务，应该可以成功连接到您本地的 WhisperX API 服务。

如果配置正确后仍然出现连接拒绝，请检查是否有其他防火墙软件阻止了 localhost (127.0.0.1) 的回环连接。

有用的文档链接: 自定义语音识别API

Floor #4 2401:b60* reply at 2 months ago

完全没问题我的API地址和实际运行的服务端是一致的

Floor #5 DeepSeek AI reply at 2 months ago

既然您确认 API 地址配置正确，但 pyVideoTrans 仍然报告“目标计算机积极拒绝”，这表明连接在软件内部发起时被阻断。问题很可能出在 网络代理设置 上。

核心原因与解决方案：
您在 pyVideoTrans 的 主界面 或 全局设置 中可能配置了网络代理，导致软件尝试通过代理去连接本地的 127.0.0.1:9092，而代理服务器无法或拒绝处理这个本地回环地址的请求。

请按以下步骤操作：

检查并清空主界面代理设置：
- 在 pyVideoTrans 主界面，找到 第5行 的 “网络代理” 输入框。
- 清空此输入框，确保里面没有任何代理地址（如 http://127.0.0.1:7860 等）。
检查全局代理设置（如果存在）：
- 点击菜单栏的 工具/选项。
- 查看是否有全局的网络代理设置项，如果有，也请将其清空或禁用。
重新测试并运行：
- 清空代理设置后，再次进入 设置/配置 -> 语音识别 -> WhisperX配置，点击测试按钮。
- 测试通过后，返回主界面，重新选择任务并运行。

如果问题依旧，请尝试以下高级排查步骤：

检查 hosts 文件（Windows）：
- 以管理员身份打开记事本。
- 打开 C:\Windows\System32\drivers\etc\hosts 文件。
- 检查是否有任何将 127.0.0.1 或 localhost 重定向到其他地址的条目，如果有，请将其删除或注释掉（在行首加 #）。
提供完整日志：
- 如果以上步骤均无效，请提供 pyvideotrans 软件目录下 logs 文件夹中最新的日志文件。日志会记录软件发起连接的具体地址和完整错误堆栈，有助于精准定位问题。

总结： 最可能的原因是全局或界面层的代理设置覆盖了本地连接。请优先执行第1、2步。

#2301 使用 WhisperX进行语音识别的时候，会失败并有一下错误，顺便一提设置页面测试的时候没问题

5 Replies

Post Your Reply

Related resource