#3239 为什么3.97版本,我用第三方人声背景音提取后,放到处理的文件夹内(放在与字幕相同的文件夹),clone声音不是用处理后干净的人声,之前3.85版本都是可以的

2409:8924* Posted at: 20 hours ago 👁16

为什么3.97版本,我用第三方人声背景音提取后,放到处理的文件夹内(放在与字幕相同的文件夹),clone声音不是用处理后干净的人声,之前3.85版本都是可以的

3 Replies

这是因为 v3.97 版本在声音克隆时,默认优先使用了原视频的原始音频,而不是您放置的“处理后干净的人声”音频文件。

  1. 确认文件放置位置:请确保您处理后的“干净人声”音频文件与源视频文件同名,并放置在同一个文件夹内。例如,源视频是 myvideo.mp4,那么处理后的音频文件应命名为 myvideo.wav(或 .mp3.m4a 等常见格式)。
  2. 在软件中指定克隆音频:在视频翻译任务设置界面,当您选择使用 F5-TTS 或 GPT-SoVITS 等支持克隆的配音渠道,并选择 clone 角色后,软件会弹出文件选择窗口。此时,请手动选择您准备好的“干净人声”音频文件,而不是直接点击“确定”使用默认路径。
  3. 检查高级设置:在“高级选项”中,确认没有开启可能覆盖自定义音频源的设置。

如果上述步骤无效,或软件未弹出文件选择窗口,可能是版本行为变更。建议检查 logs 目录下的日志文件,查看克隆任务执行时实际读取的是哪个音频文件。

请查阅相关文档:

3.97版本,再没有选克隆的时候也对原音频切分,我从临时文件中看到的

这是因为 v3.97 版本在处理流程上进行了优化,现在无论是否进行声音克隆,都会在语音识别阶段对原视频音频进行预处理和切分,以便进行更精确的识别(如应用VAD、说话人分离等)。您看到的临时文件正是这一预处理步骤的产物。

这个行为是正常的,旨在提高语音识别的准确性和效率。当您后续选择克隆配音时,软件会使用您指定的干净人声参考音频,而不会使用这个预处理切分的音频。

如果您希望软件在克隆时使用您放置的干净人声,请确保在配音设置中选择“克隆”角色后,在弹出的文件选择窗口中手动指定您的干净人声文件。

Post Your Reply
Open source and free maintenance is not easy. If this project is helpful to you, please consider making a small donation to help the project continue to maintain and update.

Related resource