#4756 如果用分离背景音然后再和成,会有杂音是什么情况

2a14:4900* Posted at: 10 hours ago

如果用分离背景音然后再和成,会有杂音是什么情况

3 Replies

软件中的“分离人声背景声”及“重新嵌入背景声”功能,其核心效果取决于所使用的人声分离模型的精度。由于该功能默认使用 CPU 计算,模型精度有限,在复杂背景音乐或多乐器场景下,分离出的背景音中混入人声残留,或者人声中丢失了部分高频细节,在重新合成时就会表现为“杂音”或“空洞感”。

为确认是模型本身精度不足还是环境配置问题,请按照以下步骤排查:

  1. 检查文件来源
    如果您使用的是 Windows 预打包版,请确认已使用完整包解压(补丁包不含模型),模型文件必须完整。如果模型下载不完整,也会导致分离效果差产生杂音。
  2. 尝试开启“循环背景音”
    在主界面点击“设置更多参数”,找到 循环背景音背景音量。如果背景音乐本身短暂播放后直接静音或停顿,在合成时会被听觉上感受为杂音。请将 背景音量 调至 0.5~0.8,并勾选 循环背景音 看看是否改善。
  3. 直接排除此功能
    如果视频背景噪声不严重,建议 不选中“分离人声背景声”。直接使用主界面右上角的 降噪 功能即可。降噪 也是用来去除背景噪音提升识别率的(速度比分离背景声慢一些),但不会在最终合成时使用嘈杂的分离背景音,也就不会产生杂音。

如果以上方法仍无法解决,暂无法确定具体原因。请提供软件安装目录下的 logs/ 文件夹中最新的日志文件(复制底部约30行报错信息)以便分析。

因为原视频的片头有背景音乐,想保留

这是由于软件内置的人声分离模型(UVR-onnx)精度有限,且仅支持 CPU 运算,在处理复杂背景音乐时容易残留人声或产生失真,重新合成后表现为杂音。
若希望保留原视频的片头背景音乐,不建议使用软件内置的分离功能,而是改用专业的外部工具(如 UVR5-GUI)分离出高质量的背景声文件,然后手动导入软件使用。

具体操作步骤

  1. 使用第三方工具分离背景声

    • 下载并运行 UVR5-GUI(或其他专业人声分离软件)。
    • 将原始视频(或直接从视频中提取的音频)拖入 UVR5,选择分离人声和伴奏(格式选 .wav)。
    • 分离后,你会得到两个文件:人声 vocal.wav 和背景声 instrument.wav
  2. 将分离后的文件放入软件缓存目录

    • 假设你的视频路径为 F:/videos/myhomework.mp4,在视频所在目录下创建 _video_out 文件夹,再在其中创建 myhomework-mp4(注意后缀规则:3.87以上版本需命名为 视频名-后缀,如 myhomework-mp4)。
    • 将 UVR5 分离出的 vocal.wavinstrument.wav 复制到 _video_out/myhomework-mp4/ 目录下。
  3. 在 pyVideoTrans 中正常进行视频翻译

    • 在主界面中,按常规选择视频、翻译语言等。
    • 打开“设置更多参数”,勾选 分离人声背景声重新嵌入背景声,并调整 背景音量(建议 0.5~0.8)。
    • 勾选 循环背景音(如果背景声时长不足视频时长)。
    • 开始处理。软件会自动使用你放入的 vocal.wavinstrument.wav,不再使用内置的低质量分离模型,从而避免杂音。
注意:如果视频较长或背景音乐复杂,建议使用 UVR5 的 MDX23CDemucs 模型(效果较好)。分离前请确保人声和伴奏文件命名正确且格式为 .wav

请查阅相关文档:

Post Your Reply
Open source and free maintenance is not easy. If this project is helpful to you, please consider making a small donation to help the project continue to maintain and update.

Related resource