您提到的“自动克隆”功能,在 pyVideoTrans 中通常指 GPT-SoVITS 语音克隆。该功能允许您使用一段参考音频,克隆出相似音色的语音用于配音。
要实现此功能,请按以下步骤操作:
1. 确保已部署 GPT-SoVITS 服务
- 本地部署:您需要在本地或另一台电脑上运行 GPT-SoVITS 项目。具体部署方法请参考其官方仓库。
- 关键点:服务启动后,您会获得一个 API 地址,通常是
http://127.0.0.1:9880(如果部署在本机)。
2. 在 pyVideoTrans 中配置
- 在软件主界面,点击菜单栏的 “设置” -> “GPT-SoVITS设置”。
- 在弹出窗口中,填写您部署好的 GPT-SoVITS 服务的 API地址(例如
http://127.0.0.1:9880)。 - 点击 “测试连接”,确保连接成功。
- 点击 “保存”。
3. 使用克隆功能进行配音
- 在主界面完成 “语音识别” 和 “翻译” 步骤后,软件会弹出字幕编辑窗口。
- 在字幕编辑窗口的右上角,选择 “配音” 选项卡。
- 在 “配音角色” 下拉列表中,选择以 “clone” 开头的角色(例如
clone_zh)。 - 选择角色后,软件会提示您 上传或选择一段参考音频(用于克隆音色)。
- 上传参考音频后,即可使用克隆的音色为当前字幕进行配音。
注意事项
- 参考音频质量:建议使用清晰、无背景噪音、音色稳定的单人语音片段,时长5-30秒为宜。
- 服务状态:使用克隆配音前,请确保您的 GPT-SoVITS 服务正在运行。
- 其他克隆方案:软件也支持 CosyVoice、F5-TTS 等本地语音克隆/合成方案,您可以在“配音”设置中选择尝试。
如果您在部署 GPT-SoVITS 服务或连接过程中遇到具体错误,请提供详细的错误信息或日志,以便进一步分析。