#3055 服务终端信息F:\ai\GPT-SoVITS-v2pro-20250604>.\runtime\python api_v2.py-TTS Config-device : cudais_half

240e:341* Posted at: 5 months ago

服务终端信息F:\ai\GPT-SoVITS-v2pro-20250604>.\runtime\python api_v2.py

-TTS Config

-
device : cuda
is_half : True
version : v2
t2s_weights_path : GPT_SoVITS/pretrained_models/gsv-v2final-pretrained/s1bert25hz-5kh-longer-epoch=12-step=369668.ckpt
vits_weights_path : GPT_SoVITS/pretrained_models/gsv-v2final-pretrained/s2G2333k.pth
bert_base_path : GPT_SoVITS/pretrained_models/chinese-roberta-wwm-ext-large

cnhuhbert_base_path : GPT_SoVITS/pretrained_models/chinese-hubert-base

Loading Text2Semantic weights from GPT_SoVITS/pretrained_models/gsv-v2final-pretrained/s1bert25hz-5kh-longer-epoch=12-step=369668.ckpt
Loading VITS weights from GPT_SoVITS/pretrained_models/gsv-v2final-pretrained/s2G2333k.pth.
Loading BERT weights from GPT_SoVITS/pretrained_models/chinese-roberta-wwm-ext-large
Loading CNHuBERT weights from GPT_SoVITS/pretrained_models/chinese-hubert-base
INFO: Started server process [10732]
INFO: Waiting for application startup.
INFO: Application startup complete.

F:\ai\GPT-SoVITS-v2pro-20250604>curl -X POST "http://127.0.0.1:9880/tts" -H "Content-Type: application/json" -d "{\"text\":\"你好。这是一个测试\",\"text_lang\":\"zh\",\"ref_audio_path\":\"F:/ai/GPT-SoVITS-v2pro-20250604/马保国.wav\",\"prompt_text\":\"有两个年轻人，三十多岁，一个体重九十多公斤，一个体重八十多公斤。\",\"prompt_lang\":\"zh\",\"speed\":1.0,\"volume\":1.0,\"noise_scale\":0.6,\"length_scale\":1.0}" -o test_simple.wav
% Total % Received % Xferd Average Speed Time Time Time Current

                             Dload  Upload   Total   Spent    Left  Speed

100 156k 100 156k 100 314 141k 284 0:00:01 0:00:01 --:--:-- 141k
生成一个两秒音频，用记事本打开，得到RIFF$q WAVEfmt } ? data q

Set seed to 2012702101
并行推理模式已开启
分桶处理模式已开启
实际输入的参考文本: 有两个年轻人，三十多岁，一个体重九十多公斤，一个体重八十多公斤。

切分文本

实际输入的目标文本:
。你好。这是一个测试
实际输入的目标文本(切句后):
['你好。这是一个测试。']

提取文本Bert特征

100%|████████████████████████████████████████████████████████████████████████████████████| 1/1 [00:00

Floor #1 DeepSeek reply at 5 months ago

这是由于 GPT-SoVITS API 服务启动成功，但 pyVideoTrans 软件在连接时使用了错误的 API 接口路径或参数格式导致的。

确认服务状态：根据你的终端信息，GPT-SoVITS-v2pro 的 API 服务已成功启动在 http://127.0.0.1:9880，并且使用 curl 命令测试 /tts 接口可以正常生成音频文件。
检查 pyVideoTrans 配置：在 pyVideoTrans 的“TTS设置”中，选择“GPT-SoVITS”渠道。
- API地址：应填写 http://127.0.0.1:9880。
- API路径：对于 GPT-SoVITS v2pro 版本，应使用 /tts 接口。请确保在配置中填写正确。
核对参数：GPT-SoVITS v2pro 的 API 参数与旧版可能不同。pyVideoTrans 需要发送符合 v2pro 接口要求的 JSON 数据。请确保你使用的 pyVideoTrans 版本支持 GPT-SoVITS v2pro 的 API 格式。
查看日志：如果配置正确但仍报错，请打开 pyVideoTrans 软件根目录下的 logs 文件夹，查看最新的日志文件，找到与 GPT-SoVITS 连接相关的具体错误信息。

请查阅相关文档：

GPT-SoVITS API 使用方法

Floor #2 240e:341* reply at 5 months ago

如何使用 curl 命令测试 /tts

Floor #3 DeepSeek reply at 5 months ago

你提供的终端信息中已经包含了正确的 curl 命令测试方法。该命令成功生成了音频文件 test_simple.wav，证明你的 GPT-SoVITS API 服务 /tts 接口工作正常。

核心命令解析：
你执行的命令是：

curl -X POST "http://127.0.0.1:9880/tts" -H "Content-Type: application/json" -d "{\"text\":\"你好。这是一个测试\",\"text_lang\":\"zh\",\"ref_audio_path\":\"F:/ai/GPT-SoVITS-v2pro-20250604/马保国.wav\",\"prompt_text\":\"有两个年轻人，三十多岁，一个体重九十多公斤，一个体重八十多公斤。\",\"prompt_lang\":\"zh\",\"speed\":1.0,\"volume\":1.0,\"noise_scale\":0.6,\"length_scale\":1.0}" -o test_simple.wav

-X POST: 指定使用 POST 方法。
"http://127.0.0.1:9880/tts": API 地址和路径。
-H "Content-Type: application/json": 设置请求头，表明发送的是 JSON 数据。
-d "...": 发送的 JSON 数据体，包含了要合成的文本、参考音频路径、提示文本等参数。
-o test_simple.wav: 将服务器返回的音频流保存到文件 test_simple.wav。

结论：
你的 /tts 接口测试成功。如果 pyVideoTrans 软件调用失败，问题在于软件内部的 API 请求构造或参数传递，而非服务端接口本身。请按照上一条回复的指引，重点检查 pyVideoTrans 中 GPT-SoVITS 渠道的配置，并查看软件日志以获取具体错误信息。

请查阅相关文档：

GPT-SoVITS API 使用方法

Floor #4 240e:341* reply at 5 months ago

终端纤细如下F:\ai\GPT-SoVITS-v2pro-20250604>curl -X POST "http://127.0.0.1:9880/tts" -H "Content-Type: application/json" -d "{\"text\":\"你好。这是一个测试\",\"text_lang\":\"zh\",\"ref_audio_path\":\"F:/ai/GPT-SoVITS-v2pro-20250604/马保国.wav\",\"prompt_text\":\"有两个年轻人，三十多岁，一个体重九十多公斤，一个体重八十多公斤。\",\"prompt_lang\":\"zh\",\"speed\":1.0,\"volume\":1.0,\"noise_scale\":0.6,\"length_scale\":1.0}" -o test_simple.wav
% Total % Received % Xferd Average Speed Time Time Time Current

                             Dload  Upload   Total   Spent    Left  Speed

100 144k 100 143k 100 314 100k 220 0:00:01 0:00:01 --:--:-- 101k返回音频无声用记事本打开得到RIFF$? WAVEfmt } ? data ?

Floor #5 DeepSeek reply at 5 months ago

这是由于 curl 命令请求成功，但 GPT-SoVITS 服务返回的音频数据是静音或无效的。核心原因是请求参数中的参考音频路径或提示文本与模型不匹配，导致合成失败。检查参考音频：确认路径 F:/ai/GPT-SoVITS-v2pro-20250604/马保国.wav 下的音频文件确实存在，并且是有效的、包含清晰人声的 WAV 文件。检查提示文本：参数 prompt_text 的内容 有两个年轻人，三十多岁，一个体重九十多公斤，一个体重八十多公斤。 必须与参考音频 马保国.wav 中的说话内容完全一致。请用音频播放软件打开参考音频，确认其说话内容就是这句提示文本。如果内容不匹配，模型无法正确提取音色特征，会导致合成静音或乱音。检查文本语言：确保 text_lang 和 prompt_lang 都设置为 zh（中文）。重新测试：修正上述问题后，再次运行相同的 curl 命令。如果问题依旧，请查看启动 GPT-SoVITS 服务的终端窗口，看是否有任何错误日志输出。请查阅相关文档：GPT-SoVITS API 使用方法

#3055 服务终端信息F:\ai\GPT-SoVITS-v2pro-20250604>.\runtime\python api_v2.py-TTS Config-device : cudais_half

cnhuhbert_base_path : GPT_SoVITS/pretrained_models/chinese-hubert-base

切分文本

提取文本Bert特征

5 Replies

请查阅相关文档：

请查阅相关文档：

Post Your Reply

Related resource

#3055 服务终端信息F:\ai\GPT-SoVITS-v2pro-20250604&gt;.\runtime\python api_v2.py-TTS Config-device : cudais_half

cnhuhbert_base_path : GPT_SoVITS/pretrained_models/chinese-hubert-base

切分文本

提取文本Bert特征

5 Replies

请查阅相关文档：

请查阅相关文档：

Post Your Reply

Related resource

#3055 服务终端信息F:\ai\GPT-SoVITS-v2pro-20250604>.\runtime\python api_v2.py-TTS Config-device : cudais_half