#3055 服务终端信息F:\ai\GPT-SoVITS-v2pro-20250604>.\runtime\python api_v2.py-TTS Config-device : cudais_half

240e:341* Posted at: 22 hours ago 👁19

服务终端信息F:\ai\GPT-SoVITS-v2pro-20250604>.\runtime\python api_v2.py












-TTS Config










-
device : cuda
is_half : True
version : v2
t2s_weights_path : GPT_SoVITS/pretrained_models/gsv-v2final-pretrained/s1bert25hz-5kh-longer-epoch=12-step=369668.ckpt
vits_weights_path : GPT_SoVITS/pretrained_models/gsv-v2final-pretrained/s2G2333k.pth
bert_base_path : GPT_SoVITS/pretrained_models/chinese-roberta-wwm-ext-large

cnhuhbert_base_path : GPT_SoVITS/pretrained_models/chinese-hubert-base

Loading Text2Semantic weights from GPT_SoVITS/pretrained_models/gsv-v2final-pretrained/s1bert25hz-5kh-longer-epoch=12-step=369668.ckpt
Loading VITS weights from GPT_SoVITS/pretrained_models/gsv-v2final-pretrained/s2G2333k.pth.
Loading BERT weights from GPT_SoVITS/pretrained_models/chinese-roberta-wwm-ext-large
Loading CNHuBERT weights from GPT_SoVITS/pretrained_models/chinese-hubert-base
INFO: Started server process [10732]
INFO: Waiting for application startup.
INFO: Application startup complete.

F:\ai\GPT-SoVITS-v2pro-20250604>curl -X POST "http://127.0.0.1:9880/tts" -H "Content-Type: application/json" -d "{\"text\":\"你好。这是一个测试\",\"text_lang\":\"zh\",\"ref_audio_path\":\"F:/ai/GPT-SoVITS-v2pro-20250604/马保国.wav\",\"prompt_text\":\"有两个年轻人,三十多岁,一个体重九十多公斤,一个体重八十多公斤。\",\"prompt_lang\":\"zh\",\"speed\":1.0,\"volume\":1.0,\"noise_scale\":0.6,\"length_scale\":1.0}" -o test_simple.wav
% Total % Received % Xferd Average Speed Time Time Time Current

                             Dload  Upload   Total   Spent    Left  Speed

100 156k 100 156k 100 314 141k 284 0:00:01 0:00:01 --:--:-- 141k
生成一个两秒音频,用记事本打开,得到RIFF$q WAVEfmt    } ?   data q

Set seed to 2012702101
并行推理模式已开启
分桶处理模式已开启
实际输入的参考文本: 有两个年轻人,三十多岁,一个体重九十多公斤,一个体重八十多公斤。

切分文本

实际输入的目标文本:
。你好。这是一个测试
实际输入的目标文本(切句后):
['你好。这是一个测试。']

提取文本Bert特征

100%|████████████████████████████████████████████████████████████████████████████████████| 1/1 [00:00

5 Replies

这是由于 GPT-SoVITS API 服务启动成功,但 pyVideoTrans 软件在连接时使用了错误的 API 接口路径或参数格式导致的。

  1. 确认服务状态:根据你的终端信息,GPT-SoVITS-v2pro 的 API 服务已成功启动在 http://127.0.0.1:9880,并且使用 curl 命令测试 /tts 接口可以正常生成音频文件。
  2. 检查 pyVideoTrans 配置:在 pyVideoTrans 的“TTS设置”中,选择“GPT-SoVITS”渠道。

    • API地址:应填写 http://127.0.0.1:9880
    • API路径:对于 GPT-SoVITS v2pro 版本,应使用 /tts 接口。请确保在配置中填写正确。
  3. 核对参数:GPT-SoVITS v2pro 的 API 参数与旧版可能不同。pyVideoTrans 需要发送符合 v2pro 接口要求的 JSON 数据。请确保你使用的 pyVideoTrans 版本支持 GPT-SoVITS v2pro 的 API 格式。
  4. 查看日志:如果配置正确但仍报错,请打开 pyVideoTrans 软件根目录下的 logs 文件夹,查看最新的日志文件,找到与 GPT-SoVITS 连接相关的具体错误信息。

请查阅相关文档:

如何使用 curl 命令测试 /tts

你提供的终端信息中已经包含了正确的 curl 命令测试方法。该命令成功生成了音频文件 test_simple.wav,证明你的 GPT-SoVITS API 服务 /tts 接口工作正常。

核心命令解析:
你执行的命令是:

curl -X POST "http://127.0.0.1:9880/tts" -H "Content-Type: application/json" -d "{\"text\":\"你好。这是一个测试\",\"text_lang\":\"zh\",\"ref_audio_path\":\"F:/ai/GPT-SoVITS-v2pro-20250604/马保国.wav\",\"prompt_text\":\"有两个年轻人,三十多岁,一个体重九十多公斤,一个体重八十多公斤。\",\"prompt_lang\":\"zh\",\"speed\":1.0,\"volume\":1.0,\"noise_scale\":0.6,\"length_scale\":1.0}" -o test_simple.wav
  • -X POST: 指定使用 POST 方法。
  • "http://127.0.0.1:9880/tts": API 地址和路径。
  • -H "Content-Type: application/json": 设置请求头,表明发送的是 JSON 数据。
  • -d "...": 发送的 JSON 数据体,包含了要合成的文本、参考音频路径、提示文本等参数。
  • -o test_simple.wav: 将服务器返回的音频流保存到文件 test_simple.wav

结论:
你的 /tts 接口测试成功。如果 pyVideoTrans 软件调用失败,问题在于软件内部的 API 请求构造或参数传递,而非服务端接口本身。请按照上一条回复的指引,重点检查 pyVideoTrans 中 GPT-SoVITS 渠道的配置,并查看软件日志以获取具体错误信息。

请查阅相关文档:

终端纤细如下F:\ai\GPT-SoVITS-v2pro-20250604>curl -X POST "http://127.0.0.1:9880/tts" -H "Content-Type: application/json" -d "{\"text\":\"你好。这是一个测试\",\"text_lang\":\"zh\",\"ref_audio_path\":\"F:/ai/GPT-SoVITS-v2pro-20250604/马保国.wav\",\"prompt_text\":\"有两个年轻人,三十多岁,一个体重九十多公斤,一个体重八十多公斤。\",\"prompt_lang\":\"zh\",\"speed\":1.0,\"volume\":1.0,\"noise_scale\":0.6,\"length_scale\":1.0}" -o test_simple.wav
% Total % Received % Xferd Average Speed Time Time Time Current

                             Dload  Upload   Total   Spent    Left  Speed

100 144k 100 143k 100 314 100k 220 0:00:01 0:00:01 --:--:-- 101k返回音频无声用记事本打开得到RIFF$? WAVEfmt    } ?   data ?

这是由于 curl 命令请求成功,但 GPT-SoVITS 服务返回的音频数据是静音或无效的。核心原因是请求参数中的参考音频路径或提示文本与模型不匹配,导致合成失败。检查参考音频:确认路径 F:/ai/GPT-SoVITS-v2pro-20250604/马保国.wav 下的音频文件确实存在,并且是有效的、包含清晰人声的 WAV 文件。检查提示文本:参数 prompt_text 的内容 有两个年轻人,三十多岁,一个体重九十多公斤,一个体重八十多公斤。 必须与参考音频 马保国.wav 中的说话内容完全一致。请用音频播放软件打开参考音频,确认其说话内容就是这句提示文本。如果内容不匹配,模型无法正确提取音色特征,会导致合成静音或乱音。检查文本语言:确保 text_langprompt_lang 都设置为 zh(中文)。重新测试:修正上述问题后,再次运行相同的 curl 命令。如果问题依旧,请查看启动 GPT-SoVITS 服务的终端窗口,看是否有任何错误日志输出。请查阅相关文档:GPT-SoVITS API 使用方法

Post Your Reply
Open source and free maintenance is not easy. If this project is helpful to you, please consider making a small donation to help the project continue to maintain and update.

Related resource