#2301 使用 WhisperX进行语音识别的时候,会失败并有一下错误,顺便一提设置页面测试的时候没问题

2401:b60* Posted at: 2 hours ago 👁23

语音识别阶段出错:[WhisperX] 网络连接失败:
Traceback (most recent call last):
File "httpx\_transports\default.py", line 101, in map_httpcore_exceptions
File "httpx\_transports\default.py", line 250, in handle_request
File "httpcore\_sync\connection_pool.py", line 216, in handle_request
File "httpcore\_sync\connection_pool.py", line 196, in handle_request
File "httpcore\_sync\connection.py", line 99, in handle_request
File "httpcore\_sync\connection.py", line 76, in handle_request
File "httpcore\_sync\connection.py", line 122, in _connect
File "httpcore\_backends\sync.py", line 205, in connect_tcp
File "contextlib.py", line 153, in exit
File "httpcore\_exceptions.py", line 14, in map_exceptions
httpcore.ConnectError: [WinError 10061] 由于目标计算机积极拒绝,无法连接。

The above exception was the direct cause of the following exception:

Traceback (most recent call last):
File "openai\_base_client.py", line 982, in request
File "httpx\_client.py", line 914, in send
File "httpx\_client.py", line 942, in _send_handling_auth
File "httpx\_client.py", line 979, in _send_handling_redirects
File "httpx\_client.py", line 1014, in _send_single_request
File "httpx\_transports\default.py", line 249, in handle_request
File "contextlib.py", line 153, in exit
File "httpx\_transports\default.py", line 118, in map_httpcore_exceptions
httpx.ConnectError: [WinError 10061] 由于目标计算机积极拒绝,无法连接。

The above exception was the direct cause of the following exception:

Traceback (most recent call last):
File "videotrans\task\job.py", line 113, in run
File "videotrans\task\trans_create.py", line 365, in recogn
File "videotrans\recognition\__init__.py", line 222, in run
File "videotrans\recognition\_base.py", line 80, in run
File "videotrans\recognition\_whisperx.py", line 46, in _exec
File "openai\_utils\_utils.py", line 286, in wrapper
File "openai\resources\audio\transcriptions.py", line 406, in create
File "openai\_base_client.py", line 1259, in post
File "openai\_base_client.py", line 1014, in request
openai.APIConnectionError: Connection error.

TaskCfg(cache_folder='E:/AI/【视频语音互相转】win-pyvideotrans-3.90/tmp/15928/8d034176d4', target_dir='D:/下载/_video_out/index_01-wav', remove_noise=False, is_separate=False, detect_language='zh-cn', subtitle_language=None, source_language='简体中文', target_language='简体中文', source_language_code='zh-cn', target_language_code='zh-cn', source_sub='D:/下载/_video_out/index_01-wav/zh-cn.srt', target_sub='D:/下载/_video_out/index_01-wav/zh-cn.srt', source_wav='E:/AI/【视频语音互相转】win-pyvideotrans-3.90/tmp/15928/8d034176d4/zh-cn.wav', source_wav_output='D:/下载/_video_out/index_01-wav/zh-cn.m4a', target_wav='E:/AI/【视频语音互相转】win-pyvideotrans-3.90/tmp/15928/8d034176d4/target.wav', target_wav_output='D:/下载/_video_out/index_01-wav/zh-cn.m4a', subtitles='', novoice_mp4='E:/AI/【视频语音互相转】win-pyvideotrans-3.90/tmp/15928/8d034176d4/novoice.mp4', noextname='index_01', shibie_audio=None, targetdir_mp4='D:/下载/_video_out/index_01-wav/index_01.mp4', instrument=None, vocal=None, back_audio='', background_music=None, app_mode='tiqu', subtitle_type=0, volume='+0%', pitch='+0Hz', voice_rate='+0%', voice_role='No', copysrt_rawvideo=True, clear_cache=True, translate_type=0, tts_type=0, recogn_type=17, model_name='large-v3-turbo', split_type=0, voice_autorate=False, video_autorate=False, cuda=True, name='D:/下载/index_01.wav', basename='index_01.wav', ext='wav', dirname='D:/下载', shound_del_name=None, uuid='8d034176d4', remove_silent_mid=True, align_sub_audio=True, enable_diariz=False, nums_diariz=0, rephrase=1, only_out_mp4=False)

5 Replies

错误信息显示 由于目标计算机积极拒绝,无法连接,这表明 WhisperX 在尝试连接其 API 服务器时被拒绝。虽然设置页面测试正常,但实际处理时连接失败,可能原因及解决方法如下:

  1. 网络代理问题:WhisperX 使用的是 OpenAI 的 API 接口。请检查您是否在软件中正确配置了网络代理。

    • 在软件主界面第5行找到“网络代理”输入框。
    • 填入可用的代理地址,格式如 http://127.0.0.1:你的代理端口
    • 如果已填写,请尝试更换为其他可用的代理节点。
  2. API 密钥或基础URL配置错误:请确认 WhisperX 渠道的配置。

    • 进入菜单栏 设置/配置 -> 语音识别 选项卡。
    • 找到并点击 WhisperX 渠道的“配置”按钮。
    • 检查 API KeyBase URL 是否正确。Base URL 通常应为 https://api.openai.com/v1,除非您使用第三方代理。
    • 如果使用第三方代理服务,请确保 Base URL 填写的是该服务提供的正确地址。
  3. 临时性网络波动或服务限制:OpenAI 的 API 服务可能出现临时性问题或对您的 IP/账户进行了速率限制。

    • 稍等几分钟后重试任务。
    • 如果您使用的是共享或免费 API 密钥,可能已达到调用限制,请更换密钥或等待限制解除。
  4. 防火墙/安全软件拦截:部分防火墙或安全软件可能阻止了软件的非浏览器网络连接。

    • 暂时禁用防火墙或安全软件后重试(操作前请评估风险)。
    • 在防火墙设置中为 pyVideoTranssp.exe 添加出站规则例外。

如果以上方法均无效,请提供 videotrans/logs/ 目录下最新的日志文件,以便进一步分析具体的请求地址和错误详情。

有用的文档链接: OpenAI语音识别API

[2025-12-26 17:26:45] PS E:\AI\whisperx-api> uv run app.py
E:\AI\whisperx-api.venv\lib\site-packages\pyannote\audio\core\io.py:212: UserWarning: torchaudio._backend.list_audio_backends has been deprecated. This deprecation is part of a large refactoring effort to transition TorchAudio into a maintenance phase. The decoding and encoding capabilities of PyTorch for both audio and video are being consolidated into TorchCodec. Please see https://github.com/pytorch/audio/issues/3902 for more information. It will be removed from the 2.9 release.
torchaudio.list_audio_backends()
2025-12-26 17:26:54,312 - INFO - 成功从 token.txt 文件中读取 Hugging Face 令牌。
2025-12-26 17:26:54,313 - INFO - 使用设备: cpu,计算类型: int8
2025-12-26 17:26:54,321 - INFO - FFmpeg 环境检查通过。
2025-12-26 17:26:54,322 - INFO - 服务已启动,正在监听 http://127.0.0.1:9092
2025-12-26 17:26:54,324 - INFO - Serving on http://127.0.0.1:9092
ImmutableMultiDict([('model', 'tiny'), ('language', 'zh'), ('response_format', 'diarized_json'), ('max_speakers', '-1')])
2025-12-26 17:31:02,476 - INFO - 收到请求: 模型='tiny', 语言='zh', 提示词='无'
2025-12-26 17:31:02,479 - INFO - 正在将上传的文件 'E:/AI/【视频语音互相转】win-pyvideotrans-3.90/videotrans/styles/no-remove.wav' 转换为标准的 16kHz 单声道 WAV 格式...
2025-12-26 17:31:02,510 - INFO - 文件格式转换成功。
2025-12-26 17:31:02,534 - INFO - 正在加载 Whisper 模型 'tiny'...
E:\AI\whisperx-api.venv\lib\site-packages\ctranslate2\__init__.py:8: UserWarning: pkg_resources is deprecated as an API. See https://setuptools.pypa.io/en/latest/pkg_resources.html. The pkg_resources package is slated for removal as early as 2025-11-30. Refrain from using this package or pin to Setuptools

您正在使用本地部署的 WhisperX API 服务,并且日志显示服务已成功启动在 http://127.0.0.1:9092。然而,pyVideoTrans 在连接时出现了“目标计算机积极拒绝”的错误。

核心原因与解决方案:

这通常是因为 pyVideoTrans 中配置的 WhisperX API 地址与您实际运行的本地服务地址不匹配

请按以下步骤检查和修正:

  1. 在 pyVideoTrans 中检查并配置 WhisperX 的 API 地址:

    • 打开 pyVideoTrans。
    • 点击菜单栏的 设置/配置
    • 切换到 语音识别 选项卡。
    • 在渠道列表中找到 WhisperX,点击其右侧的 配置 按钮。
    • 在弹出的配置窗口中,找到 Base URLAPI 地址 的输入框。
    • 将其修改为您本地服务运行的地址,即 http://127.0.0.1:9092
    • 确保 API Key 字段留空或填写一个任意字符(如果您的本地服务不需要密钥)。
    • 点击 测试 按钮,应该会返回连接成功的提示。
  2. 确认本地服务运行正常:

    • 您的日志显示服务已在 http://127.0.0.1:9092 监听,这是正确的。请确保在 pyVideoTrans 进行测试和任务运行时,这个命令行窗口保持打开状态。
  3. 在 pyVideoTrans 主界面选择正确的识别渠道:

    • 完成上述配置后,在主界面第2行的“语音识别”下拉菜单中,务必选择 “WhisperX”,而不是其他选项(如 faster-whisper 或 OpenAI-Whisper)。

完成以上设置后,再次尝试运行任务,应该可以成功连接到您本地的 WhisperX API 服务。

如果配置正确后仍然出现连接拒绝,请检查是否有其他防火墙软件阻止了 localhost (127.0.0.1) 的回环连接。

有用的文档链接: 自定义语音识别API

完全没问题 我的API地址和实际运行的服务端 是一致的

既然您确认 API 地址配置正确,但 pyVideoTrans 仍然报告“目标计算机积极拒绝”,这表明连接在软件内部发起时被阻断。问题很可能出在 网络代理设置 上。

核心原因与解决方案:
您在 pyVideoTrans 的 主界面全局设置 中可能配置了网络代理,导致软件尝试通过代理去连接本地的 127.0.0.1:9092,而代理服务器无法或拒绝处理这个本地回环地址的请求。

请按以下步骤操作:

  1. 检查并清空主界面代理设置:

    • 在 pyVideoTrans 主界面,找到 第5行“网络代理” 输入框。
    • 清空此输入框,确保里面没有任何代理地址(如 http://127.0.0.1:7860 等)。
  2. 检查全局代理设置(如果存在):

    • 点击菜单栏的 工具/选项
    • 查看是否有全局的网络代理设置项,如果有,也请将其清空或禁用
  3. 重新测试并运行:

    • 清空代理设置后,再次进入 设置/配置 -> 语音识别 -> WhisperX配置,点击 测试 按钮。
    • 测试通过后,返回主界面,重新选择任务并运行。

如果问题依旧,请尝试以下高级排查步骤:

  1. 检查 hosts 文件(Windows):

    • 以管理员身份打开记事本。
    • 打开 C:\Windows\System32\drivers\etc\hosts 文件。
    • 检查是否有任何将 127.0.0.1localhost 重定向到其他地址的条目,如果有,请将其删除或注释掉(在行首加 #)。
  2. 提供完整日志:

    • 如果以上步骤均无效,请提供 pyvideotrans 软件目录下 logs 文件夹中最新的日志文件。日志会记录软件发起连接的具体地址和完整错误堆栈,有助于精准定位问题。

总结: 最可能的原因是全局或界面层的代理设置覆盖了本地连接。请优先执行第1、2步。

Post Your Reply
Open source and free maintenance is not easy. If this project is helpful to you, please consider making a small donation to help the project continue to maintain and update.

Donate: https://ko-fi.com/jianchang512

Trending Questions