#4591 配音中出现原视频的声音

59.62* Posted at: 1 hour ago 👁12

生成的视频中出现了原视频的人声

3 Replies

配音结果中包含原视频人声,通常是因为未对原始音频进行人声与背景音分离,导致配音直接叠加在原人声轨道上。

解决方案:

  1. 勾选“分离人声背景声”

    • 在主界面“设置更多参数…”中找到并勾选 “分离人声背景声”
    • 如需保留背景音乐,可同时勾选 “重新嵌入背景声”(会移除原人声后,在配音阶段重新加入背景音)。
  2. 确认配音渠道已正常生成输出

    • 检查日志中是否出现“tts failed”或配音文件生成失败的错误,若出错请更换配音渠道(如 Edge-TTS)或调整并发数。
  3. 检查最终合成参数

    • 确保未选择“不嵌入字幕”以外的异常选项,且配音音频已被正确指定为最终输出音频轨道。

请查阅相关文档:

current_slot_audio_len=2240 slot_duration=2760] | Timeline: 107697 -> 110457
[DEBUG] [Audio-Sync] Line=41 | 音频末尾补静音 480ms | [current_slot_audio_len=1880 slot_duration=2360] | Timeline: 110457 -> 112817
[DEBUG] [Audio-Sync] Line=42 | 音频末尾补静音 680ms | [current_slot_audio_len=2080 slot_duration=2760] | Timeline: 112817 -> 115577
[DEBUG] [Audio-Sync] Line=43 | 音频末尾补静音 600ms | [current_slot_audio_len=2160 slot_duration=2760] | Timeline: 115577 -> 118337
[DEBUG] [Audio-Sync] Line=44 | 音频末尾补静音 9040ms | [current_slot_audio_len=3320 slot_duration=12360] | Timeline: 118337 -> 130697
[DEBUG] [Audio-Sync] Line=45 | 音频溢出截断 1680->1625 | [current_slot_audio_len=1680 slot_duration=1625] | Timeline: 130697 -> 132322
[DEBUG] [Audio-Sync] Line=46 | 音频溢出截断 1720->1637 | [current_slot_audio_len=1720 slot_duration=1637] | Timeline: 132322 -> 133959
[DEBUG] [Audio-Sync] Line=47 | 音频末尾补静音 3040ms | [current_slot_audio_len=2120 slot_duration=5160] | Timeline: 133959 -> 139119
[DEBUG] [Audio-Sync] Line=48 | 音频溢出截断 2240->2200 | [current_slot_audio_len=2240 slot_duration=2200] | Timeline: 139119 -> 141319
[DEBUG] [Audio-Sync] Line=49 | 音频溢出截断 2000->1951 | [current_slot_audio_len=2000 slot_duration=1951] | Timeline: 141319 -> 143270
[DEBUG] [Audio-Sync] Line=50 | 音频末尾补静音 120ms | [current_slot_audio_len=1840 slot_duration=1960] | Timeline: 143270 -> 145230
[DEBUG] [Audio-Sync] Line=51 | 音频末尾补静音 1840ms | [current_slot_audio_len=3240 slot_duration=5080] | Timeline: 145230 -> 150310
[DEBUG] [Audio-Sync] Line=52 | 音频末尾补静音 1760ms | [current_slot_audio_len=2040 slot_duration=3800] | Timeline: 150310 -> 154110
[DEBUG] [Audio-Sync] Line=53 | 音频溢出截断 2080->2048 | [current_slot_audio_len=2080 slot_duration=2048] | Timeline: 154110 -> 156158
[DEBUG] [Audio-Sync] Line=54 | 音频末尾补静音 40ms | [current_slot_audio_len=2160 slot_duration=2200] | Timeline: 156158 -> 158358
[DEBUG] [Audio-Sync] Line=55 | 音频末尾补静音 1120ms | [current_slot_audio_len=2200 slot_duration=3320] | Timeline: 158358 -> 161678
[DEBUG] [Audio-Sync] Line=56 | 音频溢出截断 800->760 | [current_slot_audio_len=800 slot_duration=760] | Timeline: 161678 -> 162438
[DEBUG] [Audio-Sync] Line=57 | 音频溢出截断 520->469 | [current_slot_audio_len=520 slot_duration=469] | Timeline: 162438 -> 162907
[DEBUG] [Audio-Sync] Line=58 | 音频溢出截断 680->510 | [current_slot_audio_len=680 slot_duration=510] | Timeline: 162907 -> 163417
[DEBUG] [Audio-Sync] Line=59 | 音频溢出截断 520->434 | [current_slot_audio_len=520 slot_duration=434] | Timeline: 163417 -> 163851
[DEBUG] [Audio-Sync] Line=60 | 音频末尾补静音 640ms | [current_slot_audio_len=520 slot_duration=1160] | Timeline: 163851 -> 165011
[DEBUG] [Audio-Sync] Line=61 | 音频溢出截断 2000->1928 | [current_slot_audio_len=2000 slot_duration=1928] | Timeline: 165011 -> 166939
[DEBUG] concat_txt='D:/videotrans/tmp/27924/8a4efdb5c5/final_audio_concat.txt',filelist[0]='D:/videotrans/tmp/27924/8a4efdb5c5/final_slot_cut_0.wav'
[DEBUG] [Audio-Concat] 最终音频已生成: D:/videotrans/tmp/27924/8a4efdb5c5/target.wav
[DEBUG] [最终视频合成]copy模式,无需重新编码:
['-y', '-progress', 'compose1778911808.3949285.txt', '-i', 'novoice.mp4', '-i', 'origin_audio.m4a', '-map', '0:v', '-map', '1:a', '-c:v', 'copy', '-c:a', 'copy', '-movflags', '+faststart', '-fps_mode', 'vfr', '-t', '166.992000', 'laste_target.mp4']
[DEBUG] [FFMPEG-CMD]:
ffmpeg -hide_banner -nostdin -ignore_unknown -threads 0 -y -progress compose1778911808.3949285.txt -i novoice.mp4 -i origin_audio.m4a -map 0:v -map 1:a -c:v copy -c:a copy -movflags +faststart -fps_mode vfr -t 166.992000 laste_target.mp4

根据日志,最终视频合成时使用的音频文件是 origin_audio.m4a(即原始音频),而非配音生成的 target.wav。这说明配音阶段未能成功替换原音频轨道,导致最终输出保留了原人声。

原因与解决方案:

  1. 配音步骤被跳过或失败

    • 确认主界面中是否已选择配音角色(如 Edge-TTS 下的某个发音人)。
    • 检查日志中是否出现 tts failedtarget.wav not exists 等错误。若有,请重试或更换配音渠道(如切换到 Edge-TTS 并降低并发数)。
    • 确保“配音后暂停秒数”和线程数设置合理(建议并发数设为1,暂停5秒)。
  2. 流程未正确衔接

    • 在“高级选项”中查看“是否强制使用原音频回退”选项(若有则取消)。
    • 确认未勾选“不配音”或“仅字幕生成”模式。
  3. 二次识别或其它拦截

    • 如果选中了“二次识别”,该过程不会影响配音文件本身,但最终合成仍依赖配音文件的存在。如配音文件未生成,程序会回退到原音频。

建议操作:

  1. 在主界面勾选“清理已生成”后重新执行一次。
  2. 若使用 Edge-TTS,在“高级选项”中将并发线程数设为1,配音后暂停设为5秒。
  3. 查看完整日志,定位 [Dubbing][TTS] 相关记录,确认每行字幕是否都生成了 wav 文件。

请查阅相关文档:

Post Your Reply
Open source and free maintenance is not easy. If this project is helpful to you, please consider making a small donation to help the project continue to maintain and update.

Related resource