#4451 RuntimeError: {'message': 'tts failed', 'Exception': 'giongnuct1.wav not exists'}

2001:ee0* Posted at: 20 days ago

{'message': 'tts failed', 'Exception': 'giongnuct1.wav not exists'}:
Traceback (most recent call last):
File "videotrans\util\ListenVoice.py", line 16, in run
File "videotrans\tts\__init__.py", line 354, in run
File "videotrans\tts\_base.py", line 181, in run
RuntimeError: {'message': 'tts failed', 'Exception': 'giongnuct1.wav not exists'}


=
system:Windows-10-10.0.26200-SP0
version:v3.99
frozen:True
language:en
root_dir:E:/subpy

3 Replies

The core cause is that the TTS engine failed to generate or locate the temporary audio file (giongnuct1.wav), often due to excessive concurrency, rate‑limiting, insufficient disk space, or antivirus blocking.

Steps to resolve:

  1. In the menu, go to Tools/Options → Advanced Settings → Subtitle Dubbing Adjustments, set Concurrent dubbing threads to 1 and Pause seconds after dubbing to 5–10. This reduces pressure on the TTS service.
  2. Ensure the software is installed in a short path without Chinese characters (e.g., D:\pyVideoTrans) and that the disk has enough free space. Do not run from inside a compressed archive.
  3. Temporarily disable any security software or add sp.exe and the installation folder to its exclusion list.
  4. Try a different TTS source (e.g., if using Edge‑TTS, switch to another free provider or a paid one) to isolate the issue.
  5. If the problem persists, check the logs/YYYY-MM-DD.log file in the software directory for more detailed error context, and provide the last 30 lines when asking for further help.

请查阅相关文档:

Here is the log. Please help me check it.

[ERROR] GPT-SoVITS ref_wav=''
返回错误:error_data={'message': 'tts failed', 'Exception': 'giongnuct1.wav not exists'}

[DEBUG] [字幕配音]渠道9:共耗时:1s
[DEBUG] [字幕配音]渠道9:共耗时:0s
[DEBUG] [字幕配音]渠道9:共耗时:0s
[DEBUG] [字幕配音]渠道9:共耗时:0s
[DEBUG] [字幕配音]渠道9:共耗时:0s
[DEBUG] [字幕配音]渠道9:共耗时:0s
[DEBUG] [字幕配音]渠道9:共耗时:0s
[DEBUG] GPT-SoVITS 当前需要发送的配音数据:data={'text': '你好啊我的朋友', 'text_language': 'zh', 'extra': 'pyvideotrans', 'ostype': 'win32', 'refer_wav_path': 'giongnuct1.wav', 'prompt_text': '再次睁眼,我竟回到择选夫君的那日,看着夫君坚定的求娶我那二等蓝孔雀的姐妞,我便知道她也重生了。', 'prompt_language': 'zh', 'speed': 1.0}
self.api_url='http://127.0.0.1:9880'
[ERROR] GPT-SoVITS ref_wav=''
返回错误:error_data={'detail': 'Not Found'}

[ERROR] GPT-SoVITS ref_wav=''
返回错误:error_data={'detail': 'Not Found'}

[DEBUG] [字幕配音]渠道9:共耗时:1s
[DEBUG] GPT-SoVITS 当前需要发送的配音数据:data={'text': '你好啊我的朋友', 'text_lang': 'zh', 'ref_audio_path': 'giongnuct1.wav', 'prompt_text': '再次睁眼,我竟回到择选夫君的那日,看着夫君坚定的求娶我那二等蓝孔雀的姐妞,我便知道她也重生了。', 'prompt_lang': 'zh', 'speed_factor': 1.0, 'text_split_method': 'cut0'}
self.api_url='http://127.0.0.1:9880/tts'
[ERROR] GPT-SoVITS ref_wav=''
返回错误:error_data={'message': 'tts failed', 'Exception': 'giongnuct1.wav not exists'}

[ERROR] GPT-SoVITS ref_wav=''
返回错误:error_data={'message': 'tts failed', 'Exception': 'giongnuct1.wav not exists'}

[DEBUG] [字幕配音]渠道9:共耗时:1s
[DEBUG] GPT-SoVITS 当前需要发送的配音数据:data={'text': '你好啊我的朋友', 'text_lang': 'zh', 'ref_audio_path': 'giongnuct.wav', 'prompt_text': '再次睁眼,我竟回到择选夫君的那日,看着夫君坚定的求娶我那二等蓝孔雀的姐妞,我便知道她也重生了。', 'prompt_lang': 'zh', 'speed_factor': 1.0, 'text_split_method': 'cut0'}
self.api_url='http://127.0.0.1:9880/tts'
[ERROR] GPT-SoVITS ref_wav=''
返回错误:error_data={'message': 'tts failed', 'Exception': 'giongnuct.wav not exists'}

[ERROR] GPT-SoVITS ref_wav=''
返回错误:error_data={'message': 'tts failed', 'Exception': 'giongnuct.wav not exists'}

[DEBUG] [字幕配音]渠道9:共耗时:1s

核心原因是 GPT-SoVITS 克隆配音所需的参考音频文件(giongnuct1.wav / giongnuct.wav)未能生成或无法被找到,导致 TTS 引擎报错退出。

根据日志,错误反复出现 ref_wav='' 返回错误: {'message': 'tts failed', 'Exception': 'giongnuct1.wav not exists'},且 API 端点也返回过 {'detail': 'Not Found'},说明 GPT-SoVITS 服务已运行,但找不到指定的参考音频。

请按以下步骤排查:

  1. 确认参考音频文件

    • 该文件应由软件在“翻译视频或音频”过程中自动从视频中切取生成,存放于当前任务的临时文件夹(通常位于 tmp/ 下)。
    • 如果该文件丢失,通常是因源视频的语音片段太短或分离背景音时出错。
  2. 确保角色选择与设置匹配

    • 如果你选择了 clone 配音角色,必须满足参考音频时长 3–10 秒(多数克隆模型的要求)。
    • 前往 菜单 → 工具 → 高级选项 → 语音识别参数,将:

      • 最短语音持续毫秒 设为 3000
      • 最长语音持续秒数 设为 10
    • 并勾选 Whisper预分割音频 以及 合并过短字幕到相邻,确保字幕片段能落在安全时长内。
  3. 检查人声分离设置

    • 在主界面 设置更多参数… 中,务必勾选 分离人声背景声(否则克隆可能失败或质量极差)。
    • 处理后会自动提取纯净人声,再从中切取参考音频。
  4. 验证 GPT-SoVITS 服务配置

    • 日志中 API URL 为 http://127.0.0.1:9880(以及 /tts),请确认该服务终端窗口未关闭且能正常响应。
    • 在浏览器访问 http://127.0.0.1:9880/docshttp://127.0.0.1:9880,看服务是否存活。
    • 若端点返回 Not Found,可能需要使用正确的 API 路径,通常 GPT-SoVITS 的接口路径为 /tts(已在日志中出现),但旧版可能无需 /tts 后缀。建议根据你部署的版本调整。
  5. 降低并发,减轻压力

    • 高级选项 → 字幕配音调整 中:

      • 并发配音线程数 设为 1
      • 配音后暂停秒 设为 5 或更大,避免瞬间压力导致文件生成失败。
  6. 清理缓存重新处理

    • 在主界面左上角勾选 清理已生成,然后重新运行一次,确保不会使用旧缓存。
  7. 检查路径和权限

    • 软件安装路径不要包含中文或特殊符号(你当前 E:\subpy 看起来是英文,可以接受)。
    • 确保软件所在盘符有足够剩余空间,tmp 文件夹可正常写入。

如果上述步骤仍无法解决,请提供 GPT-SoVITS 服务的控制台日志以及该任务的完整 logs/ 目录下最新日志文件(底部 30 行),以便进一步定位。

请查阅相关文档:

Post Your Reply
Open source and free maintenance is not easy. If this project is helpful to you, please consider making a small donation to help the project continue to maintain and update.

Related resource

Similar issues already exist