#5240 omnivoice配音目标语言的配音会掺杂参考音频

35.76* Posted at: 20 hours ago

omnivoice配音目标语言的配音会掺杂参考音频,掺杂的参考音频一般在目标语言的开头部位,而且掺杂参考音频是不完整的只有一小段
版本是4.0.2
omnivoice用的技术文档提供的整合包

1 Replies

这是由于 OmniVoice 模型在处理参考音频时,参考音频的原始语音未被充分过滤或抑制,导致合成后的目标语言配音开头夹杂了参考音频的片段。常见原因是参考音频过长或包含过多源语言的完整句子,模型误将其视为需要保留的内容。

解决方案:

  1. 缩短参考音频:确保参考音频时长在 3-10 秒 之间,且仅包含一到两句清晰的人声。过长或含有复杂内容的参考音频容易导致掺杂。
  2. 清理参考音频:使用第三方工具(如 Audacity)将参考音频前/后的静音切除,并确保音频中只有单一人声、无背景噪声。
  3. 重新放置参考音频:OmniVoice 的参考音频需存放在软件根目录下的 f5-tts/ 文件夹内,并在 菜单 → TTS设置 → 设置参考音频 中正确填写文件名和文本内容(如 myaudio.wav#文本)。
  4. 尝试其他克隆渠道:如果问题持续,可改用 Qwen-TTS(本地) 或 GPT-SoVITS 等渠道,它们对参考音频的兼容性更优。

如果以上方法无效,请提供 logs/ 目录下的最新日志(复制最近 30 行报错信息),以便进一步分析。

请查阅相关文档:

Post Your Reply
Open source and free maintenance is not easy. If this project is helpful to you, please consider making a small donation to help the project continue to maintain and update. Dondate: ko-fi.com/jianchang512

Related resource