#5310 怎么训练配音角色

112.224* Posted at: 1 day ago

怎么训练配音角色

5 Replies

pyVideoTrans 本身不提供训练配音模型的直接功能,但支持通过 声音克隆(Voice Cloning) 实现类似效果——只需提供几秒参考音频,就能让目标语言配音听起来像这个音色。

要使用克隆,请按以下步骤操作:

  1. 准备参考音频
    录制一段 5–10 秒的纯人声 WAV 文件(清晰、无背景噪声、无开头结尾静音),并命名为简短英文名(例如 myvoice.wav)。
  2. 放置音频文件
    将该文件复制到软件根目录下的 f5-tts 文件夹中(若使用 GPT-SoVITS 则放在 GPT-SoVITS 软件根目录)。
  3. 配置参考文本(可选但强烈推荐)
    打开菜单 → TTS设置设置参考音频,新起一行填写:
    myvoice.wav#这段音频里说话的内容原文
    保存后关闭。
  4. 在主界面使用
    回到翻译视频主界面,配音渠道选择一个支持克隆的渠道(如 F5-TTSGPT-SoVITSCosyVoiceOmniVoice 等),配音角色下拉框就会出现刚才添加的 myvoice.wav,选中即可。

若您希望训练一个完全自定义的 TTS 模型(例如微调特定语速、情感),则需要使用外部开源项目(如 GPT-SoVITSCosyVoice)自行训练,训练完成后通过 API 接入 pyVideoTrans(在菜单 TTS设置 中选择对应本地 API 渠道并填写地址)。

请查阅相关文档:

你自带的got文件夹可以使用吗

软件根目录下并没有名为 got 的默认文件夹。
请确认您指的是哪个文件夹或文件(例如是 f5-ttsmodelstmpvideotrans 等),并提供完整的实际目录名称或报错信息,以便进一步分析。

GPT-SoVITS-v3lora-20250228

pyVideoTrans 根目录下没有名为 GPT-SoVITS-v3lora-20250228 的文件夹。该名称很可能是 GPT-SoVITS 项目的模型训练产物或版本号。

若您想将 GPT-SoVITS 自训练的模型(如 v3lora-20250228)用于 pyVideoTrans,请按以下步骤操作:

  1. 将训练好的模型文件(.ckpt.pth.yaml 等)放置在 GPT-SoVITS 项目根目录的指定位置(具体参考 GPT-SoVITS 文档)。
  2. 启动 GPT-SoVITS 的 API 服务(api.pyapi_v2.py),记下 API 地址(默认 http://127.0.0.1:9880)。
  3. 在 pyVideoTrans 中,打开菜单 → TTS设置 → GPT-SoVITS,填入 API 地址。
  4. 返回主界面,配音渠道选择 GPT-SoVITS,即可使用您训练的模型进行配音。

pyVideoTrans 本身不存储或校验 GPT-SoVITS 模型文件,所有模型操作均由您部署的 GPT-SoVITS 服务处理。

请查阅相关文档:

Post Your Reply
Open source and free maintenance is not easy. If this project is helpful to you, please consider making a small donation to help the project continue to maintain and update. Dondate: ko-fi.com/jianchang512

Related resource