#4591 配音中出现原视频的声音

59.62* Posted at: 2 months ago

生成的视频中出现了原视频的人声

Floor #1 DeepSeek reply at 2 months ago

配音结果中包含原视频人声，通常是因为未对原始音频进行人声与背景音分离，导致配音直接叠加在原人声轨道上。

解决方案：

勾选“分离人声背景声”
- 在主界面“设置更多参数…”中找到并勾选 “分离人声背景声”。
- 如需保留背景音乐，可同时勾选 “重新嵌入背景声”（会移除原人声后，在配音阶段重新加入背景音）。
确认配音渠道已正常生成输出
- 检查日志中是否出现“tts failed”或配音文件生成失败的错误，若出错请更换配音渠道（如 Edge-TTS）或调整并发数。
检查最终合成参数
- 确保未选择“不嵌入字幕”以外的异常选项，且配音音频已被正确指定为最终输出音频轨道。

请查阅相关文档：

Floor #2 59.62* reply at 2 months ago

current_slot_audio_len=2240 slot_duration=2760] | Timeline: 107697 -> 110457
[DEBUG] [Audio-Sync] Line=41 | 音频末尾补静音 480ms | [current_slot_audio_len=1880 slot_duration=2360] | Timeline: 110457 -> 112817
[DEBUG] [Audio-Sync] Line=42 | 音频末尾补静音 680ms | [current_slot_audio_len=2080 slot_duration=2760] | Timeline: 112817 -> 115577
[DEBUG] [Audio-Sync] Line=43 | 音频末尾补静音 600ms | [current_slot_audio_len=2160 slot_duration=2760] | Timeline: 115577 -> 118337
[DEBUG] [Audio-Sync] Line=44 | 音频末尾补静音 9040ms | [current_slot_audio_len=3320 slot_duration=12360] | Timeline: 118337 -> 130697
[DEBUG] [Audio-Sync] Line=45 | 音频溢出截断 1680->1625 | [current_slot_audio_len=1680 slot_duration=1625] | Timeline: 130697 -> 132322
[DEBUG] [Audio-Sync] Line=46 | 音频溢出截断 1720->1637 | [current_slot_audio_len=1720 slot_duration=1637] | Timeline: 132322 -> 133959
[DEBUG] [Audio-Sync] Line=47 | 音频末尾补静音 3040ms | [current_slot_audio_len=2120 slot_duration=5160] | Timeline: 133959 -> 139119
[DEBUG] [Audio-Sync] Line=48 | 音频溢出截断 2240->2200 | [current_slot_audio_len=2240 slot_duration=2200] | Timeline: 139119 -> 141319
[DEBUG] [Audio-Sync] Line=49 | 音频溢出截断 2000->1951 | [current_slot_audio_len=2000 slot_duration=1951] | Timeline: 141319 -> 143270
[DEBUG] [Audio-Sync] Line=50 | 音频末尾补静音 120ms | [current_slot_audio_len=1840 slot_duration=1960] | Timeline: 143270 -> 145230
[DEBUG] [Audio-Sync] Line=51 | 音频末尾补静音 1840ms | [current_slot_audio_len=3240 slot_duration=5080] | Timeline: 145230 -> 150310
[DEBUG] [Audio-Sync] Line=52 | 音频末尾补静音 1760ms | [current_slot_audio_len=2040 slot_duration=3800] | Timeline: 150310 -> 154110
[DEBUG] [Audio-Sync] Line=53 | 音频溢出截断 2080->2048 | [current_slot_audio_len=2080 slot_duration=2048] | Timeline: 154110 -> 156158
[DEBUG] [Audio-Sync] Line=54 | 音频末尾补静音 40ms | [current_slot_audio_len=2160 slot_duration=2200] | Timeline: 156158 -> 158358
[DEBUG] [Audio-Sync] Line=55 | 音频末尾补静音 1120ms | [current_slot_audio_len=2200 slot_duration=3320] | Timeline: 158358 -> 161678
[DEBUG] [Audio-Sync] Line=56 | 音频溢出截断 800->760 | [current_slot_audio_len=800 slot_duration=760] | Timeline: 161678 -> 162438
[DEBUG] [Audio-Sync] Line=57 | 音频溢出截断 520->469 | [current_slot_audio_len=520 slot_duration=469] | Timeline: 162438 -> 162907
[DEBUG] [Audio-Sync] Line=58 | 音频溢出截断 680->510 | [current_slot_audio_len=680 slot_duration=510] | Timeline: 162907 -> 163417
[DEBUG] [Audio-Sync] Line=59 | 音频溢出截断 520->434 | [current_slot_audio_len=520 slot_duration=434] | Timeline: 163417 -> 163851
[DEBUG] [Audio-Sync] Line=60 | 音频末尾补静音 640ms | [current_slot_audio_len=520 slot_duration=1160] | Timeline: 163851 -> 165011
[DEBUG] [Audio-Sync] Line=61 | 音频溢出截断 2000->1928 | [current_slot_audio_len=2000 slot_duration=1928] | Timeline: 165011 -> 166939
[DEBUG] concat_txt='D:/videotrans/tmp/27924/8a4efdb5c5/final_audio_concat.txt',filelist[0]='D:/videotrans/tmp/27924/8a4efdb5c5/final_slot_cut_0.wav'
[DEBUG] [Audio-Concat] 最终音频已生成: D:/videotrans/tmp/27924/8a4efdb5c5/target.wav
[DEBUG] [最终视频合成]copy模式，无需重新编码:
['-y', '-progress', 'compose1778911808.3949285.txt', '-i', 'novoice.mp4', '-i', 'origin_audio.m4a', '-map', '0:v', '-map', '1:a', '-c:v', 'copy', '-c:a', 'copy', '-movflags', '+faststart', '-fps_mode', 'vfr', '-t', '166.992000', 'laste_target.mp4']
[DEBUG] [FFMPEG-CMD]:
ffmpeg -hide_banner -nostdin -ignore_unknown -threads 0 -y -progress compose1778911808.3949285.txt -i novoice.mp4 -i origin_audio.m4a -map 0:v -map 1:a -c:v copy -c:a copy -movflags +faststart -fps_mode vfr -t 166.992000 laste_target.mp4

Floor #3 DeepSeek reply at 2 months ago

根据日志，最终视频合成时使用的音频文件是 origin_audio.m4a（即原始音频），而非配音生成的 target.wav。这说明配音阶段未能成功替换原音频轨道，导致最终输出保留了原人声。

原因与解决方案：

配音步骤被跳过或失败
- 确认主界面中是否已选择配音角色（如 Edge-TTS 下的某个发音人）。
- 检查日志中是否出现 tts failed 或 target.wav not exists 等错误。若有，请重试或更换配音渠道（如切换到 Edge-TTS 并降低并发数）。
- 确保“配音后暂停秒数”和线程数设置合理（建议并发数设为1，暂停5秒）。
流程未正确衔接
- 在“高级选项”中查看“是否强制使用原音频回退”选项（若有则取消）。
- 确认未勾选“不配音”或“仅字幕生成”模式。
二次识别或其它拦截
- 如果选中了“二次识别”，该过程不会影响配音文件本身，但最终合成仍依赖配音文件的存在。如配音文件未生成，程序会回退到原音频。

建议操作：

在主界面勾选“清理已生成”后重新执行一次。
若使用 Edge-TTS，在“高级选项”中将并发线程数设为1，配音后暂停设为5秒。
查看完整日志，定位 [Dubbing] 或 [TTS] 相关记录，确认每行字幕是否都生成了 wav 文件。

#4591 配音中出现原视频的声音

3 Replies

请查阅相关文档：

请查阅相关文档：

Post Your Reply

Related resource