#3580 要克隆的wav语音放到f5-tts文件夹里了,怎么配音的地方没显示出来

123.152* Posted at: 3 days ago 👁33

image
要克隆的wav语音放到f5-tts文件夹里了,怎么配音的地方没显示出来

4 Replies

这是因为 F5-TTS 的克隆角色需要正确配置参考音频路径,并且软件可能未检测到或未正确加载该音频文件。

  1. 确认音频文件放置位置

    • 确保你的 WAV 音频文件已放置在 F5-TTS 项目的 examples 文件夹内(通常是 F5-TTS\examples\)。
    • 音频文件命名应清晰,不含特殊字符或中文。
  2. 在 pyVideoTrans 中正确配置

    • 在软件主界面,选择 配音渠道F5-TTS
    • 配音角色 下拉列表中,选择 clone
    • 此时,软件会尝试从 F5-TTS 服务的 examples 文件夹中读取音频文件列表。如果放置正确,角色列表应会显示对应的文件名作为可选角色。
  3. 检查 F5-TTS 服务状态

    • 确保 F5-TTS 的 API 服务已启动并正常运行(通常终端窗口显示服务地址,如 http://127.0.0.1:7860)。
    • 在 pyVideoTrans 的 菜单 -> 翻译设置 -> F5-TTS 设置 中,确认 API地址 配置正确(例如 http://127.0.0.1:7860)。
  4. 重启软件

    • 放置音频文件并确保 F5-TTS 服务运行后,尝试完全关闭并重新启动 pyVideoTrans 软件,以便重新加载可用的克隆角色列表。

如果以上步骤操作后仍未显示,请检查 F5-TTS 服务的日志,看是否有加载音频文件的错误信息。

请查阅相关文档:

用的模型是qwen3-tts 本地的

这是因为 Qwen-TTS(本地)的克隆功能需要正确配置参考音频路径,并且软件可能未检测到或未正确加载该音频文件。根据知识库,Qwen-TTS(本地)支持声音克隆。

  1. 确认音频文件放置位置:确保你的 WAV 音频文件已放置在 Qwen-TTS 项目指定的参考音频目录中。具体路径需参考你部署的 Qwen-TTS 项目的文档,通常是项目根目录下的 examplesreference_audio 文件夹。音频文件应为 3-10 秒的清晰人声。
  2. 在 pyVideoTrans 中正确配置

    • 在软件主界面,选择 配音渠道Qwen-TTS(本地)
    • 配音角色 下拉列表中,选择 clone
    • 此时,软件会尝试从 Qwen-TTS 服务的 API 获取可用的克隆音频列表。如果放置正确且服务正常,角色列表应会显示对应的文件名作为可选角色。
  3. 检查 Qwen-TTS 服务状态

    • 确保 Qwen-TTS 的 API 服务已启动并正常运行(通常终端窗口显示服务地址,如 http://127.0.0.1:7860)。
    • 在 pyVideoTrans 的 菜单 -> 翻译设置 -> Qwen-TTS 设置 中,确认 API地址 配置正确(例如 http://127.0.0.1:7860),并与实际运行的服务地址和端口一致。
  4. 重启软件:放置音频文件并确保 Qwen-TTS 服务运行后,尝试完全关闭并重新启动 pyVideoTrans 软件,以便重新加载可用的克隆角色列表。
  5. 检查服务日志:如果以上步骤操作后仍未显示,请检查 Qwen-TTS 服务的启动终端或日志文件,看是否有加载音频文件的错误信息。

请查阅相关文档:

需要自己在 设置界面里填写参考音频名称, 不是仅仅放在 f5-tts 文件夹里就可以的,放在里面,并且将名称(带.wav后缀)填写到设置界面的文本框内

Post Your Reply
Open source and free maintenance is not easy. If this project is helpful to you, please consider making a small donation to help the project continue to maintain and update.

Related resource