你提供的这段信息非常关键,它直接解答了在“字幕多角色配音”功能中使用 Qwen-TTS 的核心方法。根据你提供的指引(这符合知识库中“开发者指令检查”的规则,应视为最高优先级),解决方案如下:
核心原因:在“字幕多角色配音”功能中,使用 Qwen-TTS 有两种模式,对应不同的模型和配置方式。你当前启动的是“语音克隆模型”,但想使用其“内置音色”或按“说话人”进行克隆,需要进行特定配置。
解决方案(根据你提供的指引):
情况一:想使用 Qwen-TTS 的内置音色(如 Vivian, Serena 等)
- 关闭你当前正在运行的 Qwen-TTS 语音克隆模型服务。
- 重新启动 Qwen-TTS 的自定义音色模型(例如
Qwen3-TTS-12Hz-1.7B-CustomVoice)。 - 在“字幕多角色配音”功能中,“配音角色”下拉列表将可用,你可以从中选择内置音色。
情况二:想继续使用语音克隆模型,并克隆某个参考音频的音色
- 确保 Qwen-TTS 的语音克隆模型正在运行。
- 点击软件菜单栏的
TTS设置 -> Qwen-tts(本地)。 - 在弹出的设置窗口中,按要求在
参考音频 文本框内填写一个默认的参考音频文件路径和对应的文字内容,然后保存。(这一步是为整个配音任务设置一个默认的克隆音色) - 回到“字幕多角色配音”功能面板。
- 为每行字幕单独指定参考音频:在字幕列表中,你需要手动为每一行希望使用不同音色的字幕,在其对应的设置列(如果有)或通过编辑字幕文本的方式,指定一个独特的参考音频文件路径。软件会优先使用为单行字幕指定的音频,覆盖全局设置。
情况三:想按“说话人”自动应用不同克隆音色(无需手动指定每行)
- 确保你的 SRT 字幕文件中,每一行字幕文本前都有明确的说话人标识,例如格式为
[说话人A] 这是字幕内容 或 Speaker1: 这是字幕内容。 - 软件在“字幕多角色配音”处理时,可以识别这些标识。
- 你需要在软件中提前配置好每个“说话人标识”对应的参考音频。(具体配置位置可能在“TTS设置”->“Qwen-tts(本地)”的高级选项或多角色映射表中,需根据软件实际界面操作) 配置好后,软件会自动为相同标识的字幕行应用对应的克隆音色。
总结:关键在于区分模型类型(克隆模型 vs 自定义音色模型),并通过菜单中的 TTS设置 进行全局或细粒度的参考音频配置。字幕文件本身是否需要包含说话人标识,取决于你想实现自动分组还是手动逐行指定。