从您提供的日志片段来看,CosyVoice 已经成功生成了配音文件 (spk_1766494215.wav),并且处理速度正常。问题在于后续的音频合并步骤。
根据官方文档和常见问题,当启用了“人声分离”但最终视频仍包含原音时,通常是由于以下原因之一:
- 音频流替换失败:软件未能用新生成的
.wav 文件替换掉分离后的人声轨道。 - 人声分离未实际执行:可能由于缓存或设置问题,人声分离步骤被跳过。
请按以下步骤操作:
第一步:强制清理并重新处理
这是解决缓存问题最直接的方法。
- 在主界面,务必勾选 “清理已生成”。
- 确保 “人声分离” 已勾选。
- 重新运行任务。
第二步:检查完整日志
处理完成后,请打开软件根目录下的 logs 文件夹,找到最新的日志文件(如 sp_20250415.log),并搜索以下关键词,将相关行提供给我:
uvr5 或 separatemerge audio 或 合并音频replace 或 替换error 或 warning
第三步:手动验证流程(如果问题持续)
您可以通过工具箱功能来手动验证每个步骤是否正常工作:
- 测试人声分离:使用 工具箱 -> 人声背景音分离 处理您的视频,检查生成的
vocals.wav 和 instrument.wav 是否正常。 测试配音替换:使用 工具箱 -> 音视频合并/分离 功能:
- 视频文件:选择您的原始视频。
- 音频文件:选择 CosyVoice 生成的
spk_1766494215.wav(位于 outputs 文件夹)。 - 字幕文件:(可选)选择生成的字幕。
- 点击合并,查看输出视频是否只有新配音(这能验证替换逻辑本身)。
总结:
目前信息显示 CosyVoice 工作正常,问题出在音频流合并环节。请先执行第一步(勾选清理已生成)并重新处理,这能解决90%的类似问题。如果无效,请提供完整日志中的关键行,以便进一步定位。