#122 翻译成为粤语tts

124.217* Posted at: 10 months ago

请问为何目标语言已选择粤语,最后翻译会变成普通话?使用gptsovist v2 API

9 Replies

Admin

1. 删掉 logs目录下所有log文件

2. 重试

3. 完毕后附上logs下当前日期命名的log文件内容

请问一下,为什么我放的视频是中文的,转出来的还是中文,我需要转成粤语

可能原因:

  1. 发音语言或目标语言选择不一致:确认主界面“翻译渠道”行的“发音语言”为“中文(简体)”,“目标语言”为“粤语”(而非“中文(简体)”)。若选错,翻译引擎会输出与源语言一致的中文。
  2. 翻译渠道不支持粤语:部分AI翻译渠道(如DeepSeek、OpenAI)需在设置中指定模型支持方言。确保渠道配置正确,并勾选“发送完整字幕”(使用完整字幕提示词可提高方言翻译质量)。建议改用Microsoft翻译或百度翻译(语言列表中有“粤语”选项)。
  3. LLM重新断句或二次翻译干扰:若启用“LLM重新断句”,也可能将粤语翻译回普通话。关闭该选项重试。

解决方案

  1. 删除 logs/ 目录下所有 .log 文件。
  2. 重新执行任务,确认目标语言明确为“粤语”。
  3. 完成后附上 logs/ 目录下最新生成的日志文件内容,以便进一步排查。

请查阅相关文档:

请问接入MINMAX 1分钟的中文转粤语大概多少钱

知识库中未包含 Minimaxi 配音渠道的具体定价信息。价格由第三方服务商实时制定,请直接访问 Minimaxi 官网 或其控制台查看当前计费标准。

配音渠道中文转粤语,哪个模型最好

对于中文转粤语的配音,推荐使用 Edge-TTS(免费,开箱即用,支持粤语),或收费的 微软 Azure TTS(效果更稳定)。本地内置渠道如 Qwen-TTS、Piper-TTS 等未明确支持粤语,不建议采用。

  • Edge-TTS:选择粤语发音人(如“HiuGaai”或“HiuMaan”),质量自然,免费无限制(注意控制并发以避免限流)。
  • 微软 Azure TTS:提供更丰富的粤语角色和风格,需申请 API Key 并付费,适合对音质要求高的场景。

如果希望使用原视频音色进行粤语克隆,目前知识库中未提及任何本地克隆渠道明确支持粤语语音合成(Qwen-TTS 本地版未列出粤语),建议先测试 OmniVoice-TTS 或 GPT-SoVITS 等是否支持粤语参考音频,但成功率不确定。因此首选仍是 Edge-TTS。

请查阅相关文档:

我要用自己的音色克隆粤语,用哪个模型比较好

对于用自己音色克隆粤语,推荐优先尝试 OmniVoice-TTS(本地API),因为它明确支持“所有语言”,理论上涵盖粤语,且对短参考音频(3-10秒)的兼容性良好。其次可测试 Qwen-TTS(本地内置),它支持中英日韩等10多种常见语言,粤语是否在内未明确标注,但属于阿里系,可能对粤语有较好支持。

配置步骤

  1. 录制一段 5-10 秒的粤语 WAV 音频(清晰单一人声,无背景噪声)。
  2. 将该音频复制到软件目录下的 f5-tts 文件夹(OmniVoice 和 Qwen-TTS 均使用此目录存放参考音频)。
  3. 菜单 -> TTS 设置 -> 设置参考音频 中填入参考音频文件名和对应说话文本(格式如 myvoice.wav#我讲粤语)。
  4. 回到主界面,配音角色下拉框选择该参考音频名称。
  5. 若使用 OmniVoice,需先启动其本地 API 服务(默认 http://127.0.0.1:7860),并在 TTS 设置中填写 URL。

若粤语克隆效果不理想,可再尝试 GPT-SoVITSCosyVoice(手动测试其是否支持粤语音频的克隆)。

参考文档:

Post Your Reply
Open source and free maintenance is not easy. If this project is helpful to you, please consider making a small donation to help the project continue to maintain and update. Dondate: ko-fi.com/jianchang512

Related resource