#5310 怎么训练配音角色

112.224* Posted at: 25 days ago

怎么训练配音角色

5 Replies

Floor #1 DeepSeek reply at 25 days ago

pyVideoTrans 本身不提供训练配音模型的直接功能，但支持通过 声音克隆（Voice Cloning） 实现类似效果——只需提供几秒参考音频，就能让目标语言配音听起来像这个音色。

要使用克隆，请按以下步骤操作：

准备参考音频
录制一段 5–10 秒的纯人声 WAV 文件（清晰、无背景噪声、无开头结尾静音），并命名为简短英文名（例如 myvoice.wav）。
放置音频文件
将该文件复制到软件根目录下的 f5-tts 文件夹中（若使用 GPT-SoVITS 则放在 GPT-SoVITS 软件根目录）。
配置参考文本（可选但强烈推荐）
打开菜单 → TTS设置 → 设置参考音频，新起一行填写：
myvoice.wav#这段音频里说话的内容原文
保存后关闭。
在主界面使用
回到翻译视频主界面，配音渠道选择一个支持克隆的渠道（如 F5-TTS、GPT-SoVITS、CosyVoice、OmniVoice 等），配音角色下拉框就会出现刚才添加的 myvoice.wav，选中即可。

若您希望训练一个完全自定义的 TTS 模型（例如微调特定语速、情感），则需要使用外部开源项目（如 GPT-SoVITS、CosyVoice）自行训练，训练完成后通过 API 接入 pyVideoTrans（在菜单 TTS设置 中选择对应本地 API 渠道并填写地址）。

请查阅相关文档：

Floor #2 112.224* reply at 25 days ago

你自带的got文件夹可以使用吗

Floor #3 DeepSeek reply at 25 days ago

软件根目录下并没有名为 got 的默认文件夹。
请确认您指的是哪个文件夹或文件（例如是 f5-tts、models、tmp、videotrans 等），并提供完整的实际目录名称或报错信息，以便进一步分析。

Floor #4 112.224* reply at 25 days ago

GPT-SoVITS-v3lora-20250228

Floor #5 DeepSeek reply at 25 days ago

pyVideoTrans 根目录下没有名为 GPT-SoVITS-v3lora-20250228 的文件夹。该名称很可能是 GPT-SoVITS 项目的模型训练产物或版本号。

若您想将 GPT-SoVITS 自训练的模型（如 v3lora-20250228）用于 pyVideoTrans，请按以下步骤操作：

将训练好的模型文件（.ckpt、.pth、.yaml 等）放置在 GPT-SoVITS 项目根目录的指定位置（具体参考 GPT-SoVITS 文档）。
启动 GPT-SoVITS 的 API 服务（api.py 或 api_v2.py），记下 API 地址（默认 http://127.0.0.1:9880）。
在 pyVideoTrans 中，打开菜单 → TTS设置 → GPT-SoVITS，填入 API 地址。
返回主界面，配音渠道选择 GPT-SoVITS，即可使用您训练的模型进行配音。

pyVideoTrans 本身不存储或校验 GPT-SoVITS 模型文件，所有模型操作均由您部署的 GPT-SoVITS 服务处理。

请查阅相关文档：