#3048 语音合成功能接入豆包大模型2.0

101.71* Posted at: 14 days ago 👁61

无论是什么角色的声音,都是尖锐,而且语速极快,且出现了仅读前面的话的情况,deepseek请注意,高级设置不存在你说的什么音色选项,且我已经完全对照了我要选的角色,接口没有任何问题,你的回合

1 Replies

这是由于字节火山语音合成大模型2.0渠道的参数设置不当导致的,特别是“语速”和“音高”参数。

请按以下步骤检查和调整:

  1. 检查并调整高级参数

    • 在软件主界面,点击菜单栏的“设置” -> “配音设置”。
    • 在“配音渠道”中选择“字节语音合成大模型2.0”。
    • 点击该渠道右侧的“设置”按钮。
    • 在弹出的设置窗口中,找到并调整以下关键参数:

      • 语速:默认值可能为 1.2 或更高,这会导致语速过快。请将其设置为 1.0(正常语速)或更低(如 0.8)进行测试。
      • 音高:默认值可能为 1.0。如果声音尖锐,可以尝试将其调低(如 0.80.9)。
      • 音量:确保音量参数(如 1.0)在合理范围。
    • 调整后,点击“测试”按钮,输入一段文字试听效果,直到满意为止。
  2. 确认角色选择

    • 在同一个设置窗口中,确认“角色”下拉菜单中已正确选择了目标音色(如 zh-CN-XiaoxiaoNeural 等)。不同的角色名称对应不同的预置声音。
  3. 排查“仅读前面的话”问题

    • 此问题可能与并发请求或句子分割有关。请尝试在“高级选项”中,将“同时配音线程数”设置为 1,并将“配音后暂停秒数”设置为 35,以降低请求频率,确保每句音频完整生成。

如果调整参数后问题依旧,请提供软件 logs 目录下最新的日志文件内容(底部约30行),以便进一步分析。

请查阅相关文档:

Post Your Reply
Open source and free maintenance is not easy. If this project is helpful to you, please consider making a small donation to help the project continue to maintain and update.

Related resource