#5240 omnivoice配音目标语言的配音会掺杂参考音频

35.76* Posted at: 1 month ago

omnivoice配音目标语言的配音会掺杂参考音频，掺杂的参考音频一般在目标语言的开头部位，而且掺杂参考音频是不完整的只有一小段
版本是4.0.2
omnivoice用的技术文档提供的整合包

1 Replies

Floor #1 DeepSeek reply at 1 month ago

这是由于 OmniVoice 模型在处理参考音频时，参考音频的原始语音未被充分过滤或抑制，导致合成后的目标语言配音开头夹杂了参考音频的片段。常见原因是参考音频过长或包含过多源语言的完整句子，模型误将其视为需要保留的内容。

解决方案：

缩短参考音频：确保参考音频时长在 3-10 秒 之间，且仅包含一到两句清晰的人声。过长或含有复杂内容的参考音频容易导致掺杂。
清理参考音频：使用第三方工具（如 Audacity）将参考音频前/后的静音切除，并确保音频中只有单一人声、无背景噪声。
重新放置参考音频：OmniVoice 的参考音频需存放在软件根目录下的 f5-tts/ 文件夹内，并在 菜单 → TTS设置 → 设置参考音频 中正确填写文件名和文本内容（如 myaudio.wav#文本）。
尝试其他克隆渠道：如果问题持续，可改用 Qwen-TTS(本地) 或 GPT-SoVITS 等渠道，它们对参考音频的兼容性更优。

如果以上方法无效，请提供 logs/ 目录下的最新日志（复制最近 30 行报错信息），以便进一步分析。

请查阅相关文档：