#2647 配音渠道选择了ChatTTS,配音角色任选其中一个,试听都会在最后听到uv_break,最后生成的视频中有很多地方说出了uv_break,请问如何解决。版本是v3.86

183.197* Posted at: 15 hours ago 👁13

配音渠道选择了ChatTTS,配音角色任选其中一个,试听都会在最后听到uv_break,最后生成的视频中有很多地方说出了uv_break,请问如何解决。

版本是v3.86

1 Replies

您遇到的 uv_break 问题,是 ChatTTS 模型在生成音频时产生的固定结尾噪音或标记词。这属于模型本身的特性,并非软件错误。要解决此问题,请按以下步骤操作:

  1. 修改 ChatTTS 模型参数

    • 在软件主界面,点击菜单栏的 工具 -> 选项 -> 高级选项
    • 在“配音调整”区域,找到“ChatTTS 参数”设置项。
    • 将默认参数 {"temperature":0.3,"top_P":0.7,"top_K":20} 修改为:

      {"temperature":0.3,"top_P":0.7,"top_K":20, "prompt":"[oral_2][laugh_0][break_6]"}
    • 这个 prompt 参数可以引导模型生成更自然的结尾,减少 uv_break 的出现。
  2. 使用音频后处理

    • 在生成视频后,如果仍有少量 uv_break 残留,可以使用软件的“工具箱”功能进行后期处理。
    • 进入 工具箱 -> 音视频合并/分离
    • 选择生成好的视频,提取其音频轨道。
    • 然后使用音频编辑软件(如 Audacity)或命令行工具(如 ffmpeg)手动裁剪掉结尾的异常部分。
  3. 考虑更换配音渠道

    • 如果上述方法效果不佳,且 uv_break 严重影响体验,建议暂时更换其他更稳定的配音渠道,例如 Edge-TTSVITS-cnenGPT-SoVITS(如果您已部署)。

核心原因uv_break 是 ChatTTS 模型在训练或推理过程中,用于标记音频段结束的内部符号,在某些参数下会“泄露”到生成的语音中。通过添加引导性提示词(prompt)可以覆盖其默认的结束行为。

请查看更多参考文档:

Post Your Reply
Open source and free maintenance is not easy. If this project is helpful to you, please consider making a small donation to help the project continue to maintain and update.

Donate: https://ko-fi.com/jianchang512

Trending Questions