#4259 [DEBUG] result={'visible': True, 'value': 'C:\Users\Admin\AppData\Local\Temp\gradio\b63dccf3804fc531779443a72840298a1eb1

2409:8a55* Posted at: 2 months ago

[DEBUG] result={'visible': True, 'value': 'C:\Users\Admin\AppData\Local\Temp\gradio\b63dccf3804fc531779443a72840298a1eb10309ab2c053fc31abd99cfb7be5d\spk_1777043456.wav', '__type__': 'update'}
[DEBUG] result={'visible': True, 'value': 'C:\Users\Admin\AppData\Local\Temp\gradio\013c8d93b84bcb809b322c3b78ddc380dc040150b9c109b344fc5b6c35de67bc\spk_1777043461.wav', '__type__': 'update'}
[DEBUG] result={'visible': True, 'value': 'C:\Users\Admin\AppData\Local\Temp\gradio\104af44553e62299c7b3f9c9157dc6402e1e1d0a20211b71574c77ce14fdf4c7\spk_1777043464.wav', '__type__': 'update'}
[DEBUG] [字幕配音]渠道11:共耗时:47s
speedrate

[DEBUG] [SpeedRate] Init. AudioRate=True, VideoRate=False, Rubberband=True
[DEBUG] [SpeedRate] 启用变速，进入对齐模式。
[DEBUG] [Calc] Mode=Only Audio Line=1 | Source=3152 Dubb=2612 -> TargetV=3152 TargetA=3152
[DEBUG] [Calc] Mode=Only Audio Line=2 | Source=4016 Dubb=4331 -> TargetV=4016 TargetA=4016
[DEBUG] [Calc] Mode=Only Audio Line=3 | Source=1800 Dubb=4830
......
[DEBUG] concat_txt='D:/win-pyvideotrans-v3.99-420/tmp/24424/354bba539d/final_audio_concat.txt',filelist[0]='D:/win-pyvideotrans-v3.99-420/tmp/24424/354bba539d/silence_head_0.wav'
[DEBUG] [Audio-Concat] 最终音频已生成: D:/win-pyvideotrans-v3.99-420/tmp/24424/354bba539d/target.wav
[DEBUG]

==准备要嵌入的字幕:self.cfg.subtitle_type=3

=
[DEBUG] 最终确定字幕嵌入类型:3 ,目标字幕语言:chi, 字幕文件:D:/win-pyvideotrans-v3.99-420/tmp/24424/354bba539d/shuang.srt

[DEBUG] [FFMPEG-CMD]:
ffmpeg -hide_banner -nostdin -ignore_unknown -threads 0 -y -i novoice.mp4 -vf tpad=stop_mode=clone:stop_duration=0.002 -c:v libx264 -crf 23 -preset medium -an final_video_with_freeze_lastend.mp4

[DEBUG] 视频定格应延长2ms，实际向上取整秒延长0.002s,操作成功。
[DEBUG] 原始hw_type='h264_nvenc'
[DEBUG] 整理后hw_type='nvenc'
[DEBUG] [尝试硬件编解码执行命令]
-y -progress compose1777043517.652968.txt -hwaccel cuda -hwaccel_output_format cuda -i novoice.mp4 -i origin_audio.m4a -filter_complex [0:v]hwdownload,format=nv12,subtitles=filename='shuang.ass',hwupload_cuda[v_out] -map [v_out] -map 1:a -c:v h264_nvenc -c:a copy -cq 23 -preset p4 -movflags +faststart -t 26.833000 laste_target.mp4

[DEBUG] 最终配置信息：self.cfg=TaskCfgVTT(is_cuda=True, uuid='875e61ada6', cache_folder='D:/win-pyvideotrans-v3.99-420/tmp/24424/875e61ada6', target_dir='D:/_Output/_video_out/测试001-mp4', source_language='英语', source_language_code='en', source_sub='D:/_Output/_video_out/测试001-mp4/en.srt', source_wav='D:/win-pyvideotrans-v3.99-420/tmp/24424/875e61ada6/en.wav', source_wav_output='D:/_Output/_video_out/测试001-mp4/en.m4a', target_language='简体中文', target_language_code='zh-cn', target_sub='D:/_Output/_video_out/测试001-mp4/zh-cn.srt', target_wav='D:/win-pyvideotrans-v3.99-420/tmp/24424/875e61ada6/target.wav', target_wav_output='D:/_Output/_video_out/测试001-mp4/zh-cn.m4a', name='D:/_Output/测试001.mp4', noextname='测试001', basename='测试001.mp4', ext='mp4', dirname='D:/_Output', shound_del_name=None, translate_type=4, tts_type=11, volume='+0%', pitch='+0Hz', voice_rate='+0%', voice_role='en_000001_80_chn.wav', voice_autorate=True, video_autorate=False, remove_silent_mid=False, align_sub_audio=True, detect_language='en', recogn_type=0, model_name='large-v3-turbo', shibie_audio=None, remove_noise=False, enable_diariz=False, nums_diariz=0, rephrase=1, fix_punc=True, subtitle_language=None, app_mode='biaozhun', subtitles='', targetdir_mp4='D:/_Output/_video_out/测试001-mp4/测试001.mp4', novoice_mp4='D:/win-pyvideotrans-v3.99-420/tmp/24424/875e61ada6/novoice.mp4', is_separate=False, embed_bgm=False, instrument=None, vocal=None, back_audio='', clear_cache=True, background_music=None, subtitle_type=3, only_out_mp4=False, recogn2pass=False, output_srt=2, copysrt_rawvideo=False)
[DEBUG] [FFMPEG-CMD]:
ffmpeg -hide_banner -nostdin -ignore_unknown -threads 0 -y -fflags +genpts -i D:/_Output/测试001.mp4 -an -c:v copy novoice.mp4

[DEBUG] [recognition]__init__:kwargs={'detect_language': 'en', 'audio_file': 'D:/win-pyvideotrans-v3.99-420/tmp/24424/875e61ada6/en.wav', 'cache_folder': 'D:/win-pyvideotrans-v3.99-420/tmp/24424/875e61ada6', 'model_name': 'large-v3-turbo', 'uuid': '875e61ada6', 'is_cuda': True, 'subtitle_type': 3, 'recogn_type': 0, 'max_speakers': -1, 'llm_post': True, 'recogn2pass': False}
[DEBUG] BaseRecogn 初始化
[DEBUG] Before VAD tenvad,_min_speech=1000ms,_max_speech=5000ms,_min_silence=250ms

[DEBUG] [Ten-VAD]Fix after:VAD断句参数：threshold=0.5,min_speech_duration_ms=1000ms,max_speech_duration_ms=5000ms,min_silent_duration_ms=250ms
[DEBUG] [Ten-VAD]音频能量: 2911.925941262958, 调整后阈值: 0.5
[DEBUG] [Ten-VAD]切分用时 0s
[DEBUG] [Ten-VAD]切分合并共用时:0s

[DEBUG] faster-whisper模式下，预先使用VAD分割音频，对large-v3-turbo模型返回的文字结果直接使用
[DEBUG] [语音识别]渠道0,large-v3-turbo:共耗时:9s
2026-04-24 23:21:53,216 - modelscope - WARNING - We can not confirm the cached file is for revision: master

Floor #1 DeepSeek reply at 2 months ago

术语表无效的可能原因及解决方法：

术语表仅适用于AI翻译渠道（如DeepSeek、ChatGPT等），传统翻译渠道（Google、微软等）不支持术语表。请确认你选择的翻译渠道属于“AI智能翻译”或“兼容AI/本地模型”，且已在对应设置中填写了API Key和模型名。
术语表格式：每行一个映射，格式为 原词=目标词 或 原词\t目标词（用等号或制表符分隔）。如果格式错误（如缺少分隔符、包含多余空格），AI可能无法正确解析。请检查术语表内容是否符合规范。
AI模型是否足够智能：部分小型本地模型（如7B）可能无法严格遵循术语表指令。建议改用DeepSeek/GPT-4等在线高级模型。
未勾选“发送完整字幕”：术语表通常随完整字幕一起发送给AI，因此建议在主界面勾选“发送完整字幕”选项（位于翻译设置区域）。同时可在“高级选项”中确认“AI翻译附带完整原字幕”已启用。
术语表文件或输入框内容被覆盖：术语表填写在主界面“翻译术语表”输入框中（非单独文件）。如果使用了外部srt字幕预导入，术语表可能未被正确传递。请确保在开始任务前，术语表输入框内有内容。
日志中无术语表相关错误：说明软件已正常发送请求，但AI可能忽略了术语表。你可以尝试在术语表中加一条测试映射（如 yes=是），翻译结果应出现“是”而非“yes”。如果依然无效，请提供日志中包含API请求和响应内容的部分（约30行）以便进一步分析。

请查阅相关文档：

Floor #2 2409:8a55* reply at 2 months ago

[DEBUG] [字幕配音]渠道11:共耗时:46s
speedrate

[DEBUG] [SpeedRate] Init. AudioRate=True, VideoRate=False, Rubberband=True
[DEBUG] [SpeedRate] 启用变速，进入对齐模式。
[DEBUG] [Calc] Mode=Only Audio Line=1 | Source=3152 Dubb=2589 -> TargetV=3152 TargetA=3152
[DEBUG] [Calc] Mode=Only Audio Line=2 | Source=4016 Dubb=3785 -> TargetV=4016 TargetA=4016
[DEBUG] [Calc] Mode=Only Audio Line=3 | Source=2800 Dubb=4110 -> TargetV=2800 TargetA=2800
[DEBUG] [Calc] Mode=Only Audio Line=4 | Source=2200 Dubb=4087 -> TargetV=2200 TargetA=2200
[DEBUG] [Calc] Mode=Only Audio Line=5 | Source=3300 Dubb=4992 -> TargetV=3300 TargetA=3300
[DEBUG] [Calc] Mode=Only Audio Line=6 | Source=4148 Dubb=3390 -> TargetV=4148 TargetA=4148
[DEBUG] [Calc] Mode=Only Audio Line=7 | Source=3352 Dubb=3030 -> TargetV=3352 TargetA=3352
[DEBUG] [Calc] Mode=Only Audio Line=8 | Source=3833 Dubb=1672 -> TargetV=3833 TargetA=3833
[DEBUG] [Audio] 开始处理 3 个音频变速任务
[DEBUG] CPU进程池:max_workers=1
[DEBUG] [Audio-RB] D:/win-pyvideotrans-v3.99-420/tmp/28256/19b4a76fe8/dubb-2.wav 原长:4109ms -> 目标:2800ms 倍率:1.47
[DEBUG] [Audio-RB] D:/win-pyvideotrans-v3.99-420/tmp/28256/19b4a76fe8/dubb-3.wav 原长:4086ms -> 目标:2200ms 倍率:1.86
[DEBUG] [Audio-RB] D:/win-pyvideotrans-v3.99-420/tmp/28256/19b4a76fe8/dubb-4.wav 原长:4992ms -> 目标:3300ms 倍率:1.51
[DEBUG] [Audio] 开始对齐拼接...
[DEBUG] [Audio-Sync] Line=1 | 音频末尾补静音 563ms | [current_slot_audio_len=2589 slot_duration=3152] | Timeline: 32 -> 3184
[DEBUG] [Audio-Sync] Line=2 | 音频末尾补静音 231ms | [current_slot_audio_len=3785 slot_duration=4016] | Timeline: 3184 -> 7200
[DEBUG] [Audio-Sync] Line=3 | 音频溢出截断 2801->2800 | [current_slot_audio_len=2801 slot_duration=2800] | Timeline: 7200 -> 10000
[DEBUG] [Audio-Sync] Line=4 | 匹配 | [current_slot_audio_len=2200 slot_duration=2200] | Timeline: 10000 -> 12200
[DEBUG] [Audio-Sync] Line=5 | 匹配 | [current_slot_audio_len=3300 slot_duration=3300] | Timeline: 12200 -> 15500
[DEBUG] [Audio-Sync] Line=6 | 音频末尾补静音 758ms | [current_slot_audio_len=3390 slot_duration=4148] | Timeline: 15500 -> 19648
[DEBUG] [Audio-Sync] Line=7 | 音频末尾补静音 322ms | [current_slot_audio_len=3030 slot_duration=3352] | Timeline: 19648 -> 23000
[DEBUG] [Audio-Sync] Line=8 | 音频末尾补静音 2161ms | [current_slot_audio_len=1672 slot_duration=3833] | Timeline: 23000 -> 26833
[DEBUG] concat_txt='D:/win-pyvideotrans-v3.99-420/tmp/28256/19b4a76fe8/final_audio_concat.txt',filelist[0]='D:/win-pyvideotrans-v3.99-420/tmp/28256/19b4a76fe8/silence_head_0.wav'
[DEBUG] [Audio-Concat] 最终音频已生成: D:/win-pyvideotrans-v3.99-420/tmp/28256/19b4a76fe8/target.wav
[DEBUG]

==准备要嵌入的字幕:self.cfg.subtitle_type=3

=
[DEBUG] 最终确定字幕嵌入类型:3 ,目标字幕语言:chi, 字幕文件:D:/win-pyvideotrans-v3.99-420/tmp/28256/19b4a76fe8/shuang.srt

[DEBUG] [FFMPEG-CMD]:
ffmpeg -hide_banner -nostdin -ignore_unknown -threads 0 -y -i novoice.mp4 -vf tpad=stop_mode=clone:stop_duration=0.001 -c:v libx264 -crf 23 -preset medium -an final_video_with_freeze_lastend.mp4

[DEBUG] 视频定格应延长1ms，实际向上取整秒延长0.001s,操作成功。
[DEBUG] 返回缓存的编解码器 Windows-264: h264_nvenc
[DEBUG] 原始hw_type='h264_nvenc'
[DEBUG] 整理后hw_type='nvenc'
[DEBUG] [尝试硬件编解码执行命令]
-y -progress compose1777078722.8408422.txt -hwaccel cuda -hwaccel_output_format cuda -i novoice.mp4 -i origin_audio.m4a -filter_complex [0:v]hwdownload,format=nv12,subtitles=filename='shuang.ass',hwupload_cuda[v_out] -map [v_out] -map 1:a -c:v h264_nvenc -c:a copy -cq 23 -preset p4 -movflags +faststart -t 26.833000 laste_target.mp4

Floor #3 DeepSeek reply at 2 months ago

根据日志内容，软件已正常完成配音对齐、音频变速、字幕嵌入和最终合成，没有报错。最后一行显示尝试硬件编解码执行命令，生成了 laste_target.mp4，说明整个流程已结束。

如果你遭遇了视频不同步、画质降低、文件过大等具体问题，请补充说明，例如：

最终视频中字幕与配音是否同步？
输出视频尺寸是否过大？
画质是否明显下降？
或提示其他错误窗口？

明确症状后就能针对性排查。如果需要优化翻译效果，可参考：

Floor #4 2409:8a55* reply at 2 months ago

术语表不起作用

Floor #5 DeepSeek reply at 2 months ago

术语表仅适用于AI翻译渠道（如DeepSeek、ChatGPT等），传统翻译渠道（Google、百度等）不支持。请确认你使用的翻译渠道是“AI智能翻译”或“兼容AI/本地模型”，且已在对应设置中填写API Key和模型名称。

如果渠道正确，请检查：

格式：每行一个映射，用英文等号 = 或制表符 \t 分隔，例如 yes=是，不要有多余空格。
发送完整字幕：在主界面勾选“发送完整字幕”，并在“高级选项”中确认“AI翻译附带完整原字幕”已启用。
AI模型能力：部分本地小模型可能忽略术语表，建议使用 DeepSeek / GPT-4 等先进模型。

如果仍无效，请提供日志中包含翻译请求和响应内容的片段（约30行），以便进一步分析。

Floor #6 2409:8a55* reply at 2 months ago

[INFO] Starting call to 'videotrans.tts._f5tts.F5TTS._item_task.._run', this is the 1st time calling it.
[INFO] Starting call to 'videotrans.tts._f5tts.F5TTS._item_task.._run', this is the 1st time calling it.
Loaded as API: http://127.0.0.1:7866/
[INFO] Starting call to 'videotrans.tts._f5tts.F5TTS._item_task.._run', this is the 1st time calling it.
Loaded as API: http://127.0.0.1:7866/
[INFO] Starting call to 'videotrans.tts._f5tts.F5TTS._item_task.._run', this is the 1st time calling it.
Loaded as API: http://127.0.0.1:7866/
[INFO] Starting call to 'videotrans.tts._f5tts.F5TTS._item_task.._run', this is the 1st time calling it.
Loaded as API: http://127.0.0.1:7866/
Loaded as API: http://127.0.0.1:7866/
[INFO] Starting call to 'videotrans.tts._f5tts.F5TTS._item_task.._run', this is the 1st time calling it.
[INFO] Starting call to 'videotrans.tts._f5tts.F5TTS._item_task.._run', this is the 1st time calling it.
[DEBUG] [字幕配音]渠道11:共耗时:2s
Loaded as API: http://127.0.0.1:7866/
Loaded as API: http://127.0.0.1:7866/
[DEBUG] 最终配置信息：self.cfg=TaskCfgVTT(is_cuda=True, uuid='19b4a76fe8', cache_folder='D:/win-pyvideotrans-v3.99-420/tmp/28256/19b4a76fe8', target_dir='D:/_Output/_video_out/测试001-mp4', source_language='英语', source_language_code='en', source_sub='D:/_Output/_video_out/测试001-mp4/en.srt', source_wav='D:/win-pyvideotrans-v3.99-420/tmp/28256/19b4a76fe8/en.wav', source_wav_output='D:/_Output/_video_out/测试001-mp4/en.m4a', target_language='简体中文', target_language_code='zh-cn', target_sub='D:/_Output/_video_out/测试001-mp4/zh-cn.srt', target_wav='D:/win-pyvideotrans-v3.99-420/tmp/28256/19b4a76fe8/target.wav', target_wav_output='D:/_Output/_video_out/测试001-mp4/zh-cn.m4a', name='D:/_Output/测试001.mp4', noextname='测试001', basename='测试001.mp4', ext='mp4', dirname='D:/_Output', shound_del_name=None, translate_type=4, tts_type=11, volume='+0%', pitch='+0Hz', voice_rate='+0%', voice_role='en_000001_80_chn.wav', voice_autorate=True, video_autorate=False, remove_silent_mid=False, align_sub_audio=True, detect_language='en', recogn_type=0, model_name='large-v3-turbo', shibie_audio=None, remove_noise=False, enable_diariz=False, nums_diariz=0, rephrase=1, fix_punc=True, subtitle_language=None, app_mode='biaozhun', subtitles='', targetdir_mp4='D:/_Output/_video_out/测试001-mp4/测试001.mp4', novoice_mp4='D:/win-pyvideotrans-v3.99-420/tmp/28256/19b4a76fe8/novoice.mp4', is_separate=False, embed_bgm=False, instrument=None, vocal=None, back_audio='', clear_cache=False, background_music=None, subtitle_type=3, only_out_mp4=False, recogn2pass=False, output_srt=2, copysrt_rawvideo=False)
[DEBUG] [FFMPEG-CMD]:
ffmpeg -hide_banner -nostdin -ignore_unknown -threads 0 -y -fflags +genpts -i D:/_Output/测试001.mp4 -an -c:v copy novoice.mp4

[INFO] Starting call to 'videotrans.tts._f5tts.F5TTS._item_task.._run', this is the 1st time calling it.
Loaded as API: http://127.0.0.1:7866/
[INFO] Starting call to 'videotrans.tts._f5tts.F5TTS._item_task.._run', this is the 1st time calling it.
Loaded as API: http://127.0.0.1:7866/
[INFO] Starting call to 'videotrans.tts._f5tts.F5TTS._item_task.._run', this is the 1st time calling it.
[INFO] Starting call to 'videotrans.tts._f5tts.F5TTS._item_task.._run', this is the 1st time calling it.
[INFO] Starting call to 'videotrans.tts._f5tts.F5TTS._item_task.._run', this is the 1st time calling it.
Loaded as API: http://127.0.0.1:7866/
Loaded as API: http://127.0.0.1:7866/
Loaded as API: http://127.0.0.1:7866/
[DEBUG] index-tts data={'ref_wav': 'D:/win-pyvideotrans-v3.99-420/f5-tts/en_000001_80_chn.wav'}
[DEBUG] post={'prompt': {'path': 'D:/win-pyvideotrans-v3.99-420/f5-tts/en_000001_80_chn.wav', 'meta': {'_type': 'gradio.FileData'}, 'orig_name': 'en_000001_80_chn.wav'}, 'text': '大家好，我是埃米尔斯·利加斯。', 'api_name': '/gen_single', 'emo_ref_path': {'path': 'D:/win-pyvideotrans-v3.99-420/f5-tts/en_000001_80_chn.wav', 'meta': {'_type': 'gradio.FileData'}, 'orig_name': 'en_000001_80_chn.wav'}}

Floor #7 DeepSeek reply at 2 months ago

日志片段只显示了配音阶段（F5-TTS）的信息，未包含翻译阶段的请求和响应内容，因此无法判断术语表是否被正确发送给AI模型。请按以下步骤排查并重新提供日志：

确认翻译渠道：在日志中 translate_type=4，请确认该数字对应的渠道是否为 AI智能翻译（如DeepSeek/OpenAI等）。传统渠道（Google、百度等）不支持术语表。
勾选发送完整字幕：主界面需勾选“发送完整字幕”，并在“高级选项”中启用“AI翻译附带完整原字幕”。
术语表格式：每行一个映射，用英文等号 = 或制表符 \t 分隔，例如 你好=Hello，不要有多余空格或标点。

如果上述无误，请提供翻译阶段的日志（约包含 [translate] 或 [trans] 字样的部分，以及API请求/响应内容），否则无法定位问题。

Floor #8 2409:8a55* reply at 2 months ago

Application started at 2026-04-25 08:51:09

First searching GPU...
[DEBUG] 返回缓存的编解码器 Windows-264: h264_nvenc
[DEBUG] 返回缓存的编解码器 Windows-265: hevc_nvenc
NVIDIA_GPU_NUMS=1
Found 1 GPUs, cost=3s
start workers...
process_max_gpu=1
multi_gpus=False
Concurrent task_nums=1
process_max=1
start 9 jobs
ended workers
[DEBUG] 最终配置信息：self.cfg=TaskCfgVTT(is_cuda=True, uuid='94b9831692', cache_folder='D:/win-pyvideotrans-v3.99-420/tmp/28256/94b9831692', target_dir='D:/_Output/_video_out/测试001-mp4', source_language='英语', source_language_code='en', source_sub='D:/_Output/_video_out/测试001-mp4/en.srt', source_wav='D:/win-pyvideotrans-v3.99-420/tmp/28256/94b9831692/en.wav', source_wav_output='D:/_Output/_video_out/测试001-mp4/en.m4a', target_language='简体中文', target_language_code='zh-cn', target_sub='D:/_Output/_video_out/测试001-mp4/zh-cn.srt', target_wav='D:/win-pyvideotrans-v3.99-420/tmp/28256/94b9831692/target.wav', target_wav_output='D:/_Output/_video_out/测试001-mp4/zh-cn.m4a', name=
......
Calc] Mode=Only Audio Line=4 | Source=2200 Dubb=4087 -> TargetV=2200 TargetA=2200
[DEBUG] [Calc] Mode=Only Audio Line=5 | Source=3300 Dubb=4992 -> TargetV=3300 TargetA=3300
[DEBUG] [Calc] Mode=Only Audio Line=6 | Source=4148 Dubb=3390 -> TargetV=4148 TargetA=4148
[DEBUG] [Calc] Mode=Only Audio Line=7 | Source=3352 Dubb=3030 -> TargetV=3352 TargetA=3352
[DEBUG] [Calc] Mode=Only Audio Line=8 | Source=3833 Dubb=1672 -> TargetV=3833 TargetA=3833
[DEBUG] [Audio] 开始处理 3 个音频变速任务
[DEBUG] CPU进程池:max_workers=1
[DEBUG] [Audio-RB] D:/win-pyvideotrans-v3.99-420/tmp/28256/19b4a76fe8/dubb-2.wav 原长:4109ms -> 目标:2800ms 倍率:1.47
[DEBUG] [Audio-RB] D:/win-pyvideotrans-v3.99-420/tmp/28256/19b4a76fe8/dubb-3.wav 原长:4086ms -> 目标:2200ms 倍率:1.86
[DEBUG] [Audio-RB] D:/win-pyvideotrans-v3.99-420/tmp/28256/19b4a76fe8/dubb-4.wav 原长:4992ms -> 目标:3300ms 倍率:1.51
[DEBUG] [Audio] 开始对齐拼接...
[DEBUG] [Audio-Sync] Line=1 | 音频末尾补静音 563ms | [current_slot_audio_len=2589 slot_duration=3152] | Timeline: 32 -> 3184
[DEBUG] [Audio-Sync] Line=2 | 音频末尾补静音 231ms | [current_slot_audio_len=3785 slot_duration=4016] | Timeline: 3184 -> 7200
[DEBUG] [Audio-Sync] Line=3 | 音频溢出截断 2801->2800 | [current_slot_audio_len=2801 slot_duration=2800] | Timeline: 7200 -> 10000
[DEBUG] [Audio-Sync] Line=4 | 匹配 | [current_slot_audio_len=2200 slot_duration=2200] | Timeline: 10000 -> 12200
[DEBUG] [Audio-Sync] Line=5 | 匹配 | [current_slot_audio_len=3300 slot_duration=3300] | Timeline: 12200 -> 15500
[DEBUG] [Audio-Sync] Line=6 | 音频末尾补静音 758ms | [current_slot_audio_len=3390 slot_duration=4148] | Timeline: 15500 -> 19648
[DEBUG] [Audio-Sync] Line=7 | 音频末尾补静音 322ms | [current_slot_audio_len=3030 slot_duration=3352] | Timeline: 19648 -> 23000
[DEBUG] [Audio-Sync] Line=8 | 音频末尾补静音 2161ms | [current_slot_audio_len=1672 slot_duration=3833] | Timeline: 23000 -> 26833
[DEBUG] concat_txt='D:/win-pyvideotrans-v3.99-420/tmp/28256/19b4a76fe8/final_audio_concat.txt',filelist[0]='D:/win-pyvideotrans-v3.99-420/tmp/28256/19b4a76fe8/silence_head_0.wav'
[DEBUG] [Audio-Concat] 最终音频已生成: D:/win-pyvideotrans-v3.99-420/tmp/28256/19b4a76fe8/target.wav
[DEBUG]

==准备要嵌入的字幕:self.cfg.subtitle_type=3

=
[DEBUG] 最终确定字幕嵌入类型:3 ,目标字幕语言:chi, 字幕文件:D:/win-pyvideotrans-v3.99-420/tmp/28256/19b4a76fe8/shuang.srt

[DEBUG] [FFMPEG-CMD]:
ffmpeg -hide_banner -nostdin -ignore_unknown -threads 0 -y -i novoice.mp4 -vf tpad=stop_mode=clone:stop_duration=0.001 -c:v libx264 -crf 23 -preset medium -an final_video_with_freeze_lastend.mp4

[DEBUG] 视频定格应延长1ms，实际向上取整秒延长0.001s,操作成功。
[DEBUG] 返回缓存的编解码器 Windows-264: h264_nvenc
[DEBUG] 原始hw_type='h264_nvenc'
[DEBUG] 整理后hw_type='nvenc'
[DEBUG] [尝试硬件编解码执行命令]
-y -progress compose1777078722.8408422.txt -hwaccel cuda -hwaccel_output_format cuda -i novoice.mp4 -i origin_audio.m4a -filter_complex [0:v]hwdownload,format=nv12,subtitles=filename='shuang.ass',hwupload_cuda[v_out] -map [v_out] -map 1:a -c:v h264_nvenc -c:a copy -cq 23 -preset p4 -movflags +faststart -t 26.833000 laste_target.mp4

Floor #9 DeepSeek reply at 2 months ago

日志中仅包含配音和对齐阶段的记录，未显示翻译过程的请求与响应内容，因此无法判断术语表是否被正确发送给AI模型。请按以下步骤操作后，重新提供翻译阶段的日志：

确认翻译渠道：在软件主界面检查“翻译渠道”是否选择了“AI智能翻译”（如DeepSeek、ChatGPT等），传统翻译渠道（Google、百度等）不支持术语表。
勾选发送完整字幕：必须在主界面勾选“发送完整字幕”，同时进入菜单→工具→高级选项，确认“AI翻译附带完整原字幕”已启用。
术语表格式：每行一个映射，使用英文等号 = 或制表符 \t 分隔，例如 你好=Hello，请检查是否有多余空格或符号。

如果上述设置均正确，请找到日志中包含 [translate]、translator 或API请求/响应字样的部分（约30行），粘贴到这里以便分析。

Floor #10 2409:8a55* reply at 2 months ago

[DEBUG] 最终配置信息：self.cfg=TaskCfgVTT(is_cuda=True, uuid='94b9831692', cache_folder='D:/win-pyvideotrans-v3.99-420/tmp/28256/94b9831692', target_dir='D:/_Output/_video_out/测试001-mp4', source_language='英语', source_language_code='en', source_sub='D:/_Output/_video_out/测试001-mp4/en.srt', source_wav='D:/win-pyvideotrans-v3.99-420/tmp/28256/94b9831692/en.wav', source_wav_output='D:/_Output/_video_out/测试001-mp4/en.m4a', target_language='简体中文', target_language_code='zh-cn', target_sub='D:/_Output/_video_out/测试001-mp4/zh-cn.srt', target_wav='D:/win-pyvideotrans-v3.99-420/tmp/28256/94b9831692/target.wav', target_wav_output='D:/_Output/_video_out/测试001-mp4/zh-cn.m4a', name='D:/_Output/测试001.mp4', noextname='测试001', basename='测试001.mp4', ext='mp4', dirname='D:/_Output', shound_del_name=None, translate_type=4, tts_type=11, volume='+0%', pitch='+0Hz', voice_rate='+0%', voice_role='en_000001_80_chn.wav', voice_autorate=True, video_autorate=False, remove_silent_mid=False, align_sub_audio=True, detect_language='en', recogn_type=0, model_name='large-v3-turbo', shibie_audio=None, remove_noise=False, enable_diariz=False, nums_diariz=0, rephrase=1, fix_punc=True, subtitle_language=None, app_mode='biaozhun', subtitles='', targetdir_mp4='D:/_Output/_video_out/测试001-mp4/测试001.mp4', novoice_mp4='D:/win-pyvideotrans-v3.99-420/tmp/28256/94b9831692/novoice.mp4', is_separate=False, embed_bgm=False, instrument=None, vocal=None, back_audio='', clear_cache=False, background_music=None, subtitle_type=3, only_out_mp4=False, recogn2pass=False, output_srt=2, copysrt_rawvideo=False)
[DEBUG] [FFMPEG-CMD]:
ffmpeg -hide_banner -nostdin -ignore_unknown -threads 0 -y -fflags +genpts -i D:/_Output/测试001.mp4 -an -c:v copy novoice.mp4

[DEBUG] 最终配置信息：self.cfg=TaskCfgVTT(is_cuda=True, uuid='19b4a76fe8', cache_folder='D:/win-pyvideotrans-v3.99-420/tmp/28256/19b4a76fe8', target_dir='D:/_Output/_video_out/测试001-mp4', source_language='英语', source_language_code='en', source_sub='D:/_Output/_video_out/测试001-mp4/en.srt', source_wav='D:/win-pyvideotrans-v3.99-420/tmp/28256/19b4a76fe8/en.wav', source_wav_output='D:/_Output/_video_out/测试001-mp4/en.m4a', target_language='简体中文', target_language_code='zh-cn', target_sub='D:/_Output/_video_out/测试001-mp4/zh-cn.srt', target_wav='D:/win-pyvideotrans-v3.99-420/tmp/28256/19b4a76fe8/target.wav', target_wav_output='D:/_Output/_video_out/测试001-mp4/zh-cn.m4a', name='D:/_Output/测试001.mp4', noextname='测试001', basename='测试001.mp4', ext='mp4', dirname='D:/_Output', shound_del_name=None, translate_type=4, tts_type=11, volume='+0%', pitch='+0Hz', voice_rate='+0%', voice_role='en_000001_80_chn.wav', voice_autorate=True, video_autorate=False, remove_silent_mid=False, align_sub_audio=True, detect_language='en', recogn_type=0, model_name='large-v3-turbo', shibie_audio=None, remove_noise=False, enable_diariz=False, nums_diariz=0, rephrase=1, fix_punc=True, subtitle_language=None, app_mode='biaozhun', subtitles='', targetdir_mp4='D:/_Output/_video_out/测试001-mp4/测试001.mp4', novoice_mp4='D:/win-pyvideotrans-v3.99-420/tmp/28256/19b4a76fe8/novoice.mp4', is_separate=False, embed_bgm=False, instrument=None, vocal=None, back_audio='', clear_cache=False, background_music=None, subtitle_type=3, only_out_mp4=False, recogn2pass=False, output_srt=2, copysrt_rawvideo=False)
[DEBUG] [FFMPEG-CMD]:
ffmpeg -hide_banner -nostdin -ignore_unknown -threads 0 -y -fflags +genpts -i D:/_Output/测试001.mp4 -an -c:v copy novoice.mp4

Floor #11 DeepSeek reply at 2 months ago

日志中仅显示了任务配置和FFmpeg命令，缺少翻译阶段的请求/响应日志。从translate_type=4看，该数值通常对应传统翻译渠道（如百度翻译、腾讯翻译等），传统翻译渠道不支持术语表。术语表仅适用于AI智能翻译渠道（如DeepSeek、ChatGPT等）。请按以下步骤排查：1. 确认当前使用的翻译渠道是否为“AI智能翻译”或“兼容AI/本地模型”。如果是传统翻译（Google、百度、DeepL等），术语表无效。2. 如果已使用AI翻译渠道，检查主界面是否勾选了“发送完整字幕”，并在菜单→工具→高级选项中确认“AI翻译附带完整原字幕”已启用。3. 检查术语表格式：每行一个映射，使用英文等号 = 或制表符 \t 分隔，如 你好=Hello。4. 在日志中找到包含 [translate]、translator 或API请求/响应字样的片段（约30行），粘贴到这里以便进一步分析。

Floor #12 2409:8a55* reply at 2 months ago

[DEBUG] 最终配置信息：self.cfg=TaskCfgVTT(is_cuda=True, uuid='94b9831692', cache_folder='D:/win-pyvideotrans-v3.99-420/tmp/28256/94b9831692', target_dir='D:/_Output/_video_out/测试001-mp4', source_language='英语', source_language_code='en', source_sub='D:/_Output/_video_out/测试001-mp4/en.srt', source_wav='D:/win-pyvideotrans-v3.99-420/tmp/28256/94b9831692/en.wav', source_wav_output='D:/_Output/_video_out/测试001-mp4/en.m4a', target_language='简体中文', target_language_code='zh-cn', target_sub='D:/_Output/_video_out/测试001-mp4/zh-cn.srt', target_wav='D:/win-pyvideotrans-v3.99-420/tmp/28256/94b9831692/target.wav', target_wav_output='D:/_Output/_video_out/测试001-mp4/zh-cn.m4a', name='D:/_Output/测试001.mp4', noextname='测试001', basename='测试001.mp4', ext='mp4', dirname='D:/_Output', shound_del_name=None, translate_type=4, tts_type=11, volume='+0%', pitch='+0Hz', voice_rate='+0%', voice_role='en_000001_80_chn.wav', voice_autorate=True, video_autorate=False, remove_silent_mid=False, align_sub_audio=True, detect_language='en', recogn_type=0, model_name='large-v3-turbo', shibie_audio=None, remove_noise=False, enable_diariz=False, nums_diariz=0, rephrase=1, fix_punc=True, subtitle_language=None, app_mode='biaozhun', subtitles='', targetdir_mp4='D:/_Output/_video_out/测试001-mp4/测试001.mp4', novoice_mp4='D:/win-pyvideotrans-v3.99-420/tmp/28256/94b9831692/novoice.mp4', is_separate=False, embed_bgm=False, instrument=None, vocal=None, back_audio='', clear_cache=False, background_music=None, subtitle_type=3, only_out_mp4=False, recogn2pass=False, output_srt=2, copysrt_rawvideo=False)
[DEBUG] [FFMPEG-CMD]:
ffmpeg -hide_banner -nostdin -ignore_unknown -threads 0 -y -fflags +genpts -i D:/_Output/测试001.mp4 -an -c:v copy novoice.mp4

Floor #13 DeepSeek reply at 2 months ago

从 translate_type=4 看，你当前使用的是传统翻译渠道（如百度、腾讯、DeepL等），这些渠道不支持术语表。术语表仅对 AI智能翻译渠道（如DeepSeek、ChatGPT、Gemini等）生效。

请按以下步骤修正：

在主界面的“翻译渠道”下拉列表中，选择 “AI智能翻译” 类别下的渠道（如 DeepSeek、OpenAI ChatGPT 等）。
在菜单→翻译设置中填写对应渠道的API Key和模型名。
在主界面勾选 “发送完整字幕”，并进入菜单→工具→高级选项，确保 “AI翻译附带完整原字幕” 已启用。
在“翻译术语表”输入框中按格式填写映射（每行一个，英文等号或制表符分隔，例如 hello=你好）。

完成上述切换后，术语表即可生效。如果仍有问题，请提供切换后的日志中包含 [translate] 或 API 请求/响应字样的片段。

Floor #14 2409:8a55* reply at 2 months ago

我的翻译渠道是deepseek，所有设置也是按上面说的设定的， translate_type=4 这个要怎么更改？

Floor #15 DeepSeek reply at 2 months ago

translate_type=4 是软件内部自动根据你选择的翻译渠道生成的数值，无需手动更改。出现这个值通常意味着你当前实际选中的是传统翻译渠道（如百度翻译、腾讯翻译等），而非 DeepSeek 这样的 AI 智能翻译渠道。请按以下步骤检查并修正：1. 确认翻译渠道选择：在主界面的“翻译渠道”下拉列表中，是否明确选择了 DeepSeek（位于“AI智能翻译”分组下），而不是传统翻译渠道列表中的任何一项（如 Google、百度、腾讯等）。2. 检查翻译设置：点击菜单 → 翻译设置 → 找到 DeepSeek 的设置面板，确认已正确填写 API Key 和模型名称（如 deepseek-chat）。3. 重启软件：修改设置后，彻底关闭软件再重新启动，确保新配置生效。如果上述步骤无误但日志中仍显示 translate_type=4，请提供当前主界面“翻译渠道”下拉列表的截图或说明你具体选择的渠道名称，以便进一步排查。

Floor #16 2409:8a55* reply at 2 months ago

Floor #17 DeepSeek reply at 2 months ago

从截图看，你确实已选择了 DeepSeek（AI智能翻译）渠道。translate_type=4 是软件内部对该渠道的编码，当选择 DeepSeek 时应该显示为 AI翻译渠道对应的值（如 30 或 40 等），而非 4（4 通常对应传统翻译渠道如百度）。这里可能有两种情况：1. 设置未生效：虽然下拉列表选择了 DeepSeek，但“翻译设置”面板中的 API Key 或模型名称未正确填写或保存。请点击菜单 → 翻译设置 → 找到 DeepSeek 面板，确认已填写 API Key 和模型名称（如 deepseek-chat）。如果之前填写过但未保存，可重新输入后点击“保存”。2. 软件未刷新配置：修改后需重启软件，确保新配置生效。请彻底关闭软件再启动。3. 尝试清理缓存：在主界面勾选“清理已生成”，然后运行一个极短的测试视频，观察新生成的日志中 translate_type 的值。如果仍显示为 4，请提供新日志中包含 translate_type= 的那行完整内容。如果以上操作后问题依旧，可能是文件写入权限或配置丢失，建议备份当前配置文件后，在软件菜单 → 工具 → 选项 → 重置为默认设置，再重新配置 DeepSeek。

Floor #18 2409:8a55* reply at 2 months ago

都执行了，没用

Floor #19 DeepSeek reply at 2 months ago

问题在于软件内部将 DeepSeek 错误识别为传统渠道（translate_type=4），导致术语表不被发送。深层原因可能是配置文件损坏或缓存残留。请按以下步骤彻底解决：

1. 重置配置文件

关闭软件。
进入软件安装目录（如 D:\pyVideoTrans），找到 set.ini 文件（或 config.ini），将其备份后删除（或移动到别处）。
重新启动软件，此时设置恢复为默认。再次配置 DeepSeek（填写 API Key 和模型名 deepseek-chat），必须点击保存。
重启软件，运行一个极短的测试视频（可勾选“清理已生成”），观察日志中 translate_type 是否变为 AI 渠道对应的值（通常是 8 或 30 等，而非 4）。

2. 检查安装完整性

如果重置后问题依旧，说明安装文件可能损坏。

备份后删除当前软件目录。
从官网重新下载完整包（非补丁包）：pyvideotrans.com/downpackage
解压到纯英文路径（如 D:\pyVideoTrans），重新配置 DeepSeek。

3. 提供更详细的日志

在启动软件、选择 DeepSeek 并执行翻译任务后，请提供 logs/ 文件夹中最新的日志文件（包含启动阶段和翻译请求部分），我帮你定位是哪一步配置没有正确加载。

Floor #20 2409:8a55* reply at 2 months ago

找不到 set.ini 文件（或 config.ini）

Floor #21 DeepSeek reply at 2 months ago

软件配置文件的默认位置在安装目录下，通常叫 set.ini，但也可能隐藏在用户目录中。如果找不到，无需手动删除，请通过软件界面操作重置：

打开软件，点击顶部菜单栏 工具/选项 → 高级选项。
在高级选项窗口底部找到 重置为默认设置 按钮，点击确认。
关闭软件，重新启动。
再次配置 DeepSeek：
- 选择 DeepSeek 渠道
- 点击菜单 → 翻译设置 → DeepSeek 面板，填写 API Key 和模型名（如 deepseek-chat），务必点击保存。
重启软件，勾选“清理已生成”，运行一个极短的测试视频。

如果重置后问题依旧，说明安装包可能已损坏，请从官网重新下载完整包（非补丁包）：
pyvideotrans.com/downpackage

解压到纯英文路径（如 D:\pyVideoTrans）后重新按上述步骤配置。

Floor #22 2409:8a55* reply at 2 months ago

没有重置为默认设置的按钮

Floor #23 DeepSeek reply at 2 months ago

软件中确实没有“重置为默认设置”按钮，你的观察是正确的。请按以下方式手动重置配置文件：

彻底关闭 pyVideoTrans 软件（包括退出系统托盘图标）。
删除配置文件：
- 打开软件安装目录（例如 D:\pyVideoTrans）。
- 在该目录下找到 set.ini 文件（也可能叫 config.ini，或只有 set 无后缀）。
- 如果找不到，请打开文件资源管理器，在安装目录的搜索框中输入 *.ini 搜索所有 INI 文件。
- 如果确实不存在 INI 文件，则配置文件可能存储在 %APPDATA% 目录下。按 Win+R 输入 %APPDATA% 回车，查找名为 pyVideoTrans 或类似名称的文件夹，删除其中的 set.ini。
重新启动软件，此时软件会以默认配置运行。
重新配置 DeepSeek：
- 在翻译渠道下拉列表中选择 DeepSeek（AI智能翻译）。
- 点击菜单 → 翻译设置 → 找到 DeepSeek 面板，填写你的 API Key 和模型名（例如 deepseek-chat），务必点击保存。
重启软件，勾选“清理已生成”，运行一个极短的测试视频，然后查看新日志中的 translate_type 值。

如果以上步骤后问题依旧，则安装包可能已损坏，【建议直接重新下载完整包】（非补丁包）并解压到纯英文路径：
下载地址

Floor #24 2409:8a55* reply at 2 months ago

不行，安装包有问题吗

Floor #25 DeepSeek reply at 2 months ago

是的，从 translate_type=4 一直无法切换到 AI 渠道来看，你当前的安装包或配置文件大概率已损坏。请按以下方式彻底解决：1. 重新下载完整包删除当前整个软件目录（注意备份已生成的输出文件）。从官网下载最新完整包：pyvideotrans.com/downpackage解压到纯英文路径（如 D:\pyVideoTrans），不要覆盖旧目录。2. 全新配置启动 sp.exe，直接选择 DeepSeek（AI智能翻译）。点击菜单 → 翻译设置 → DeepSeek 面板，填写 API Key 和模型名（如 deepseek-chat），点击保存。关闭软件，重新打开。勾选“清理已生成”，运行一个极短（几秒）的测试视频。完成后检查日志中的 translate_type 是否变为正确的 AI 渠道值（如 8 或 30 等，非 4）。如果仍显示 4，请提供新日志开头几行（包含 translate_type 所在行），我帮你确认代码是否正确加载。

Floor #26 2409:8a55* reply at 2 months ago

试了，甚到换了一个API KEY，还是translate_type=4，这个能手动改吗

Floor #27 DeepSeek reply at 2 months ago

无法手动修改，translate_type 是软件根据当前选择的翻译渠道自动生成的，手动改配置文件不会生效且可能导致异常。从你的描述来看，问题根源很可能是软件识别 DeepSeek 渠道的代码存在 bug 或安装包版本与渠道定义不匹配，导致无论你选什么 AI 翻译渠道，内部都错误地映射为传统渠道（值为4）。

既然已经完整重装并重新配置仍无效，请按以下步骤彻底排查：

确认下载的是“完整包”而非“补丁包”：
官网下载页面有“完整软件包”和“补丁包”两个选项。请确保你下载的是标题带有“完整包”字样的文件（.7z 压缩包，约 2GB 左右），而不是仅几十 MB 的“补丁包”。补丁包缺少核心依赖，会导致部分功能异常。
下载地址：https://pyvideotrans.com/downpackage
检查软件版本号：
启动软件后，点击顶部菜单栏 帮助/关于，确认版本号是否为 v3.99。如果不是，请升级到最新版。
手动定位配置文件并检查内部映射：
- 关闭软件。
- 按 Win+R 输入 %APPDATA% 回车。
- 在打开的文件夹中查找名为 pyVideoTrans（或 pyvideotrans）的文件夹，打开后找到 set.ini 文件。
- 用记事本打开 set.ini，搜索 translate_type 所在行，记录其数值。
- 同时搜索 [translate] 段落，查看 type 字段（可能为 type=4）。手动将该值改为 8（DeepSeek 通常对应值 8），保存后重新启动软件，再运行任务看日志中的 translate_type 是否变为 8。
- 注意：如果找不到 set.ini，说明配置文件被删除或不存在，请直接重新下载完整包（参考第1步）。
最后手段：替换核心文件：
如果以上都无效，可能是软件核心代码 videotrans/translator/ 目录下的渠道映射文件损坏。建议删除整个软件目录后，从官方 GitHub Release 下载最新完整包（而非官网）：https://github.com/jianchang512/pyvideotrans/releases
选择 pyVideoTrans_v3.99_full.7z 文件。

如果仍无法解决，请在日志中找到 翻译开始时的调试日志（包含 [translate] 或 [trans] 以及 API 请求的完整 30 行），我帮你进一步诊断。

#4259 [DEBUG] result={'visible': True, 'value': 'C:\Users\Admin\AppData\Local\Temp\gradio\b63dccf3804fc531779443a72840298a1eb1

27 Replies

请查阅相关文档：

如果你遭遇了视频不同步、画质降低、文件过大等具体问题，请补充说明，例如：

1. 重置配置文件

2. 检查安装完整性

3. 提供更详细的日志

Post Your Reply

Related resource