#3048 语音合成功能接入豆包大模型2.0

101.71* Posted at: 5 months ago

无论是什么角色的声音，都是尖锐，而且语速极快，且出现了仅读前面的话的情况，deepseek请注意，高级设置不存在你说的什么音色选项，且我已经完全对照了我要选的角色，接口没有任何问题，你的回合

3 Replies

Floor #1 DeepSeek reply at 5 months ago

这是由于字节火山语音合成大模型2.0渠道的参数设置不当导致的，特别是“语速”和“音高”参数。

请按以下步骤检查和调整：

检查并调整高级参数：
- 在软件主界面，点击菜单栏的“设置” -> “配音设置”。
- 在“配音渠道”中选择“字节语音合成大模型2.0”。
- 点击该渠道右侧的“设置”按钮。
- 在弹出的设置窗口中，找到并调整以下关键参数：
  - 语速：默认值可能为 1.2 或更高，这会导致语速过快。请将其设置为 1.0（正常语速）或更低（如 0.8）进行测试。
  - 音高：默认值可能为 1.0。如果声音尖锐，可以尝试将其调低（如 0.8 或 0.9）。
  - 音量：确保音量参数（如 1.0）在合理范围。
- 调整后，点击“测试”按钮，输入一段文字试听效果，直到满意为止。
确认角色选择：
- 在同一个设置窗口中，确认“角色”下拉菜单中已正确选择了目标音色（如 zh-CN-XiaoxiaoNeural 等）。不同的角色名称对应不同的预置声音。
排查“仅读前面的话”问题：
- 此问题可能与并发请求或句子分割有关。请尝试在“高级选项”中，将“同时配音线程数”设置为 1，并将“配音后暂停秒数”设置为 3 或 5，以降低请求频率，确保每句音频完整生成。

如果调整参数后问题依旧，请提供软件 logs 目录下最新的日志文件内容（底部约30行），以便进一步分析。

请查阅相关文档：

字节语音合成大模型2.0 渠道使用方法

Floor #2 2001:14bb* reply at 20 days ago

青御音

Floor #3 DeepSeek reply at 20 days ago

“青御音”是字节火山引擎语音合成模型2.0中的一个角色名称。您之前反馈的问题（尖锐、语速快、只读前面的话）仍与此渠道的参数配置有关，请按照以下步骤再次检查并调整：

在主界面找到并点击“设置更多参数…”（位于配音渠道下方的一行小字链接）。
调整语速和音调：
- 配音语速：默认是 +0%。请改为 -20% 或 -30%，以降低语速。
- 音调+：默认是 +0Hz。请改为 -20Hz 或 -30Hz，以降低音调，避免声音尖锐。
确保字节火山引擎渠道内无额外参数冲突：
- 点击菜单栏 TTS设置，选择 字节语音合成大模型2.0 对应的设置面板。
- 检查面板中是否有独立的 speed_ratio（语速）或 pitch_ratio（音高）滑块，如果存在，请将其恢复为 1.0（或关闭该面板覆盖，让主界面的全局参数生效）。
解决“仅读前面的话”：
- 仍在上方的“设置更多参数…”弹窗中，找到 “并发配音线程数”，将其设为 1。
- “配音后暂停秒” 设为 3 或 5，避免请求过快导致内容被截断。
测试：保存设置后，对一小段视频或单独的字幕进行配音测试，看问题是否解决。

如果调整后问题依然存在，请提供 logs/ 目录下最新的日志文件内容（底部约30行），以便进一步排查接口返回的原始参数错误。