#3885 TaskCfgVTT(is_cuda=True, uuid='da4e9f224c', cache_folder='D:/win-pyvideotrans-v3.98-323/tmp/13292/da4e9f224c', target_di

2a03:90c0* Posted at: 3 months ago

语音识别阶段出错 [faster-whisper(本地)] 出错了，可能内存或显存不足 Model:large-v3-turbo GPU0
Traceback (most recent call last):
File "videotrans\configure\_base.py", line 281, in _new_process
File "videotrans\process\signelobj.py", line 80, in submit_task_gpu
File "concurrent\futures\process.py", line 720, in submit
concurrent.futures.process.BrokenProcessPool: A child process terminated abruptly, the process pool is not usable anymore

Traceback (most recent call last):
File "videotrans\configure\_base.py", line 281, in _new_process
File "videotrans\process\signelobj.py", line 80, in submit_task_gpu
File "concurrent\futures\process.py", line 720, in submit
concurrent.futures.process.BrokenProcessPool: A child process terminated abruptly, the process pool is not usable anymore

During handling of the above exception, another exception occurred:

Traceback (most recent call last):
File "videotrans\task\job.py", line 105, in run
File "videotrans\task\trans_create.py", line 360, in recogn
File "videotrans\recognition\__init__.py", line 272, in run
File "videotrans\recognition\_base.py", line 143, in run
File "videotrans\recognition\_overall.py", line 33, in _exec
File "videotrans\recognition\_overall.py", line 105, in _faster
File "videotrans\configure\_base.py", line 303, in _new_process
RuntimeError: 出错了，可能内存或显存不足 Model:large-v3-turbo GPU0
Traceback (most recent call last):
File "videotrans\configure\_base.py", line 281, in _new_process
File "videotrans\process\signelobj.py", line 80, in submit_task_gpu
File "concurrent\futures\process.py", line 720, in submit
concurrent.futures.process.BrokenProcessPool: A child process terminated abruptly, the process pool is not usable anymore
TaskCfgVTT(is_cuda=True, uuid='da4e9f224c', cache_folder='D:/win-pyvideotrans-v3.98-323/tmp/13292/da4e9f224c', target_dir='Z:/tk视频/丰唇膏/已剪/无字幕/_video_out/0330-3-4-mp4', source_language='英语', source_language_code='en', source_sub='Z:/tk视频/丰唇膏/已剪/无字幕/_video_out/0330-3-4-mp4/en.srt', source_wav='D:/win-pyvideotrans-v3.98-323/tmp/13292/da4e9f224c/en.wav', source_wav_output='Z:/tk视频/丰唇膏/已剪/无字幕/_video_out/0330-3-4-mp4/en.m4a', target_language='葡萄牙语', target_language_code='pt', target_sub='Z:/tk视频/丰唇膏/已剪/无字幕/_video_out/0330-3-4-mp4/pt.srt', target_wav='D:/win-pyvideotrans-v3.98-323/tmp/13292/da4e9f224c/target.wav', target_wav_output='Z:/tk视频/丰唇膏/已剪/无字幕/_video_out/0330-3-4-mp4/pt.m4a', name='Z:/tk视频/丰唇膏/已剪/无字幕/英文/0330-3-4.mp4', noextname='0330-3-4', basename='0330-3-4.mp4', ext='mp4', dirname='//ymnas/跨境/tk视频/丰唇膏/已剪/无字幕/英文', shound_del_name=None, translate_type=0, tts_type=0, volume='+0%', pitch='+0Hz', voice_rate='+0%', voice_role='Francisca(Female/BR)', voice_autorate=True, video_autorate=True, remove_silent_mid=False, align_sub_audio=True, detect_language='en', recogn_type=0, model_name='large-v3-turbo', shibie_audio=None, remove_noise=False, enable_diariz=False, nums_diariz=0, rephrase=0, fix_punc=False, subtitle_language=None, app_mode='biaozhun', subtitles='', targetdir_mp4='Z:/tk视频/丰唇膏/已剪/无字幕/_video_out/0330-3-4-mp4/0330-3-4.mp4', novoice_mp4='D:/win-pyvideotrans-v3.98-323/tmp/13292/da4e9f224c/novoice.mp4', is_separate=False, instrument=None, vocal=None, back_audio='', clear_cache=False, background_music=None, subtitle_type=0, only_out_mp4=False, recogn2pass=True, output_srt=0, copysrt_rawvideo=False)

=
system:Windows-10-10.0.19045-SP0
version:v3.98
frozen:True
language:zh
root_dir:D:/win-pyvideotrans-v3.98-323

Floor #1 DeepSeek reply at 3 months ago

这是由于显存或内存不足导致的。错误信息明确指出在处理 large-v3-turbo 模型时，GPU0 的显存或系统内存不足以完成任务，导致子进程异常终止。

解决方案：

更换更小的模型：在语音识别渠道的下拉菜单中，将模型从 large-v3-turbo 更换为更小的模型，例如 medium、small 或 base。large-v3-turbo 模型对显存要求较高。
调整高级设置以降低显存占用：在菜单栏 工具/选项 -> 高级选项 中的【语音识别参数】区域进行如下修改：
- CUDA数据类型: 将 float32 改为 float16 或 int8。
- 识别准确度beam_size: 将 5 改为 1。
- 识别准确度best_of: 将 5 改为 1。
- 启用上下文感知: 将 true 改为 false。
检查并关闭二次识别：在主界面右上角，确保未勾选 二次识别 选项。如果同时处理多个视频，二次识别会占用额外的显存。
确保使用最大显存的显卡：如果你有多个NVIDIA显卡，请确保软件使用了显存最大的那块。v3.98-317 及之后的版本会自动选择可用显存最大的显卡。你可以尝试升级到最新版本。
检查文件路径：你的视频文件路径 Z:/tk视频/... 包含中文字符，且位于网络驱动器（Z: 盘）。这可能导致处理不稳定。建议将视频文件复制到本地硬盘（如 D:\videos）并使用纯英文路径和文件名再尝试。

请查阅相关文档：

总是提示显存不足

Floor #2 2a03:90c0* reply at 3 months ago

收到!!!

Floor #3 DeepSeek reply at 3 months ago

已收到您的确认。请按照上述步骤操作，特别是更换更小的语音识别模型（如 medium 或 small）并调整高级设置中的显存相关参数。如果问题依旧，请提供软件安装目录下 logs/ 文件夹中最新的日志文件（复制底部约30行报错信息）以便进一步分析。

Floor #4 2a03:90c0* reply at 3 months ago

我使用了medium模型，但是问题依旧，我在使用V3模型时同事查看了本机内存及GPU占用率，内存占用率就算并发任务进行时也只有 45%占用，包含系统全部。 GPU 占用率 20% 左右。显卡是2060 6GB

Floor #5 DeepSeek reply at 3 months ago

这是由于显存不足导致的。虽然系统内存和GPU占用率看起来不高，但错误信息 BrokenProcessPool: A child process terminated abruptly 和 可能内存或显存不足 明确指向了显存问题。large-v3-turbo 和 medium 模型在加载时都需要占用显存，6GB显存的RTX 2060在处理视频时可能不足以同时容纳模型和视频数据，导致进程崩溃。

解决方案：

进一步降低模型和显存占用：
- 在 菜单 -> 工具 -> 高级选项 -> 语音识别参数 中，进行如下设置：
  - CUDA数据类型：改为 int8。
  - 识别准确度beam_size：改为 1。
  - 识别准确度best_of：改为 1。
  - 启用上下文感知：改为 false。
  - 最长语音持续秒数：可以尝试设置为 5 或更低，以减少单次处理的音频长度。
确保串行处理：
- 在 菜单 -> 工具 -> 高级选项 -> 通用设置 中，勾选 批量翻译时强制串行。这可以防止多个任务同时竞争GPU显存。
- 同时，将 GPU同时任务数[重启生效] 设置为 1，然后重启软件。
检查并关闭二次识别：
- 在主界面右上角，确保 二次识别 选项未勾选。二次识别会启动另一个识别进程，可能使显存占用翻倍。
处理本地文件：
- 您的视频路径为网络驱动器 Z: 盘，这可能导致数据读取延迟或意外问题。请将视频文件复制到本地硬盘（如 D:\videos），并使用纯英文路径和文件名再尝试。
终极方案：使用更小的模型：
- 如果以上步骤均无效，说明6GB显存对于 medium 模型在当前视频长度下依然不足。请将语音识别模型更换为 small 或 base。

请查阅相关文档：

总是提示显存不足

Floor #6 2a03:90c0* reply at 3 months ago

测试完毕，关闭二次语音识别即可....

Floor #7 DeepSeek reply at 3 months ago

问题已定位。核心原因是启用了“二次识别”功能，该功能会在配音完成后再次启动一个语音识别进程，导致显存需求翻倍。在显存有限的显卡（如6GB的RTX 2060）上，这极易引发 BrokenProcessPool 和显存不足错误。

解决方案已验证：
在主界面右上角，取消勾选 二次识别 选项。

补充建议：

为确保后续任务稳定，建议在 菜单 -> 工具 -> 高级选项 -> 通用设置 中，将 GPU同时任务数 设为 1，并重启软件。
如果仍需使用二次识别来确保字幕与配音精确对齐，则必须将主语音识别模型更换为更小的型号（如 small 或 base），以释放足够的显存。

请查阅相关文档：

总是提示显存不足

Floor #8 2a03:90c0* reply at 3 months ago

新问题出现了，现在任务提示完成不报错，但是文件没有正常生成，请问高级选项里面的参数如何还原为默认参数？

Floor #9 DeepSeek reply at 3 months ago

这是由于高级选项中的某些参数设置不当，导致视频合成阶段静默失败。要恢复默认参数，请按以下步骤操作：1. 在软件安装目录（例如 D:\win-pyvideotrans-v3.98-323）下，找到并删除或重命名 config.ini 文件。2. 完全关闭 pyVideoTrans 软件。3. 重新启动软件。软件会自动生成一个包含所有默认参数的新 config.ini 文件。4. 重新配置您已知的必要设置（如网络代理、CUDA加速等）。5. 再次尝试翻译任务。如果问题依旧，请提供软件安装目录下 logs/ 文件夹中最新日志文件的底部约30行内容，以便分析具体失败环节。

Floor #10 2a03:90c0* reply at 3 months ago

可以设置任务队列处理吗？设置并发任务处理数

Floor #11 DeepSeek reply at 3 months ago

可以设置任务队列和并发处理数。pyVideoTrans 默认支持多任务并行处理，但可以通过高级选项进行精细控制。设置方法：1. 设置最大进程数（CPU任务）：在菜单 -> 工具 -> 高级选项 -> 通用设置中，找到最大进程数[重启生效]。此值控制CPU密集型任务（如音视频编码、格式转换）的并发数。建议设置为 CPU 核心数减一，修改后需要重启软件生效。2. 设置GPU同时任务数（GPU任务）：在同一区域，找到 GPU同时任务数[重启生效]。此值控制显存占用型任务（如语音识别）的并发数。对于6GB显存的RTX 2060，强烈建议设置为 1，以避免显存不足导致进程崩溃。修改后需要重启软件生效。3. 强制串行处理（队列模式）：在同一区域，勾选批量翻译时强制串行。启用后，软件将按顺序逐个处理视频，即第一个视频完全翻译结束后才开始处理第二个，形成任务队列。这是最稳定的批量处理方式，尤其适合显存有限的显卡。4. 多显卡模式：如果您有多张显存一致的NVIDIA显卡，可勾选多显卡模式[重启生效]，并相应增加 GPU同时任务数。最佳实践（针对RTX 2060 6GB）：最大进程数：根据CPU核心数设置（例如4核设为3）。GPU同时任务数：设为 1。批量翻译时强制串行：勾选。多显卡模式：不勾选。这样配置后，软件会以队列形式处理视频，每个视频的语音识别阶段独占GPU，避免显存冲突。请查阅相关文档：批量翻译视频，比如30-50-100个视频时，总是会卡住？

Floor #12 2a03:90c0* reply at 3 months ago

打开队列后只能单个任务进行，我希望同时并发4个任务进行处理，处理完4个后再处理4个，怎么设置

Floor #13 DeepSeek reply at 3 months ago

要实现“同时并发4个任务，处理完一批再处理下一批”的批处理模式，软件没有内置的直接开关，但可以通过组合配置来近似实现。核心思路是限制GPU任务并发为1，但允许CPU任务（如翻译、合成）并行，并利用“强制串行”来控制整体流程。不过，由于语音识别（最耗GPU）是每个任务的第一阶段，如果4个任务同时开始，它们会竞争GPU导致显存不足。因此，更可行的方案是设置较小的并发数，并依赖任务内部的阶段并行。配置方法：1. 在菜单 -> 工具 -> 高级选项 -> 通用设置中，进行如下设置：最大进程数[重启生效]：设置为 4 或更高（根据CPU核心数，例如8核可设为7）。GPU同时任务数[重启生效]：必须设置为 1。这是关键，确保同一时间只有一个任务进行GPU密集的语音识别。批量翻译时强制串行：取消勾选。让任务可以进入不同的处理阶段。2. 工作原理：当您提交一批任务（如8个）后，软件会将它们分为多个阶段（语音识别、翻译、配音、合成）。由于 GPU同时任务数=1，同一时刻最多只有一个任务在执行语音识别（占用GPU）。其他已完成识别的任务可以并行进入翻译、配音等CPU阶段（受最大进程数控制）。这样，从整体上看，任务会交错进行，GPU密集型阶段串行，CPU密集型阶段并行，可以近似达到“处理完一批再处理下一批”的效果，但并非严格的4个一组。重要提醒：对于RTX 2060 6GB显卡，强烈不建议设置 GPU同时任务数大于1，否则极易在语音识别阶段因显存不足导致进程崩溃（即您之前遇到的错误）。如果必须严格按4个一组执行，目前需要手动操作：每次在软件中只添加4个视频任务，等待这4个全部完成后，再添加下一批4个。请查阅相关文档：批量翻译视频，比如30-50-100个视频时，总是会卡住？

Floor #14 91.199* reply at 3 months ago

CUDA支持13.2吗

Floor #15 DeepSeek reply at 3 months ago

pyVideoTrans 内置的 CUDA 支持版本为 12.8。使用 CUDA 13.2 可能无法正常启用 GPU 加速，或导致未知错误。解决方案：1. 降级 CUDA：卸载当前 CUDA 13.2，安装 CUDA 12.8 版本。这是最稳定、兼容性最好的方案。2. 验证安装：安装 CUDA 12.8 后，在 CMD 中输入 nvcc -V 确认版本，并输入 nvidia-smi 查看显卡驱动和 CUDA 版本是否匹配。3. 检查环境变量：确保系统环境变量 PATH 中包含 CUDA 12.8 的 bin 和 lib 目录路径。4. 软件设置：在 pyVideoTrans 主界面右上角，确保已勾选 CUDA加速 选项。请查阅相关文档：windows上安装CUDA12.8和cuDNN9.11

Floor #16 45.135* reply at 2 months ago

依然提示内存不足，按照所有方法设置过，没用. 如果文件夹内需要处理的文件数大于10个就会出现。

Floor #17 DeepSeek reply at 2 months ago

问题已明确：当并发处理文件数超过10个时，即使按照所有优化方法设置，依然出现内存/显存不足。核心原因是软件默认的批量处理机制会将所有任务拆分为多个阶段并行执行，导致资源（尤其是显存）的累积占用最终超出硬件极限。解决方案：强制启用严格的串行队列处理，确保同一时间只有一个任务在运行。1. 在菜单 -> 工具 -> 高级选项 -> 通用设置中，进行如下配置：批量翻译时强制串行：勾选。最大进程数[重启生效]：设置为 1。GPU同时任务数[重启生效]：设置为 1。多显卡模式[重启生效]：取消勾选。修改后，完全关闭并重启软件。2. 此配置将强制软件按顺序处理任务，即第一个视频完全翻译、配音、合成并输出完成后，才会开始处理第二个视频。这彻底消除了多任务并发导致的资源竞争和累积占用问题。3. 如果单个视频处理时仍报内存不足，请确保：语音识别模型使用 small 或 base。在高级选项 -> 语音识别参数中，将 CUDA数据类型设为 int8，beam_size 和 best_of 均设为 1，启用上下文感知设为 false。主界面右上角的二次识别必须取消勾选。4. 检查文件路径：确保待处理的视频文件位于本地硬盘（非网络驱动器如Z:盘），且路径和文件名均为英文，无特殊符号。如果启用严格串行后问题依旧，请提供软件安装目录下 logs/ 文件夹中最新日志文件的底部约30行内容，以便分析具体在哪个环节耗尽资源。请查阅相关文档：批量翻译视频，比如30-50-100个视频时，总是会卡住？

Floor #18 162.216* reply at 2 months ago

软件卡在“声音变速对齐阶段”不动..怎么办

Floor #19 DeepSeek reply at 2 months ago

软件卡在“声音变速对齐阶段”通常是由于该阶段涉及复杂的音频处理和视频重新编码，计算量大或遇到特定文件/参数问题导致进程停滞。解决方案：1. 检查并调整对齐参数：在主界面，检查是否同时勾选了配音加速和视频慢速。如果两者都未勾选，但勾选了移除字幕间静音或对齐字幕声音，请尝试取消这些勾选，仅保留最基本的配置重新处理。2. 修改高级选项中的对齐限制：在菜单 -> 工具 -> 高级选项 -> 字幕声音画面对齐中，将音频加速最大倍数和视频慢放最大倍数都设置为较小的值（例如分别设为 50 和 2），以减少处理复杂度。3. 检查并优化视频输出设置：在同一高级选项页面的【视频输出控制】区域，尝试以下调整：输出视频压缩率：从 slower/veryslow 改为 medium 或 fast。强制软编码视频？：勾选此项（牺牲速度换取兼容性）。视频合成cuda硬解码：取消勾选此项。4. 处理单个文件测试：选择一个之前卡住的文件，单独进行处理（不要批量）。观察是否能通过此阶段。如果能，说明是批量任务资源调度问题；如果依然卡住，则是该文件或参数问题。5. 检查临时文件空间：确保软件安装目录所在的磁盘（例如D盘）有足够的剩余空间（建议大于待处理视频总大小的2倍）。6. 查看详细日志：打开软件安装目录下的 logs 文件夹，查看最新的以日期命名的 .log 文件，复制卡住时间段附近的日志内容（约30行），以便进一步分析。如果以上步骤无效，可以尝试在高级选项中勾选保留每条字幕的配音文件，然后重新处理。这有助于定位是哪一句配音导致的问题。请查阅相关文档：为何会出现声音、字幕、画面不同步

Floor #20 162.216* reply at 2 months ago

[ERROR] [Video-Cut] 片段0 [原:0-2460ms] [目标:2460ms] [PTS:1.0000] 处理异常: frame= 74 fps=0.0 q=-1.0 Lsize= 17626KiB time=00:00:02.43 bitrate=59340.5kbits/s speed=2.94x [libx264 @ 000001c0abce00c0] frame I:74 Avg QP:22.12 size:243886 [libx264 @ 000001c0abce00c0] mb I I16..4: 29.0% 51.7% 19.3% [libx264 @ 000001c0abce00c0] 8x8 transform intra:51.7% [libx264 @ 000001c0abce00c0] coded y,uvDC,uvAC intra: 54.7% 47.3% 14.1% [libx264 @ 000001c0abce00c0] i16 v,h,dc,p: 49% 23% 16% 12% [libx264 @ 000001c0abce00c0] i8 v,h,dc,ddl,ddr,vr,hd,vl,hu: 35% 26% 11% 4% 4% 5% 5% 5% 5% [libx264 @ 000001c0abce00c0] i4 v,h,dc,ddl,ddr,vr,hd,vl,hu: 34% 22% 8% 5% 6% 7% 6% 6% 5% [libx264 @ 000001c0abce00c0] i8c dc,h,v,p: 53% 17% 21% 9% [libx264 @ 000001c0abce00c0] kb/s:58532.54
[DEBUG] [Video-Cut] 片段1 [原:2460-6400ms] [目标:3940ms] [PTS:1.0000] 准备开始处理...
[DEBUG] [FFMPEG-CMD]:
ffmpeg -hide_banner -ignore_unknown -threads 0 -y -ss 00:00:02.460 -t 3.940000 -i D:/win-pyvideotrans-v3.98-329/tmp/11368/8a30adc7d9/novoice.mp4 -an -c:v libx264 -g 1 -preset veryfast -crf 20 -pix_fmt yuv420p -vf setpts=PTS -fps_mode vfr -t 3.940000 clip_1_1.000.mp4

[DEBUG] [Video-Cut] 片段1 [原:2460-6400ms] [目标:3940ms] [PTS:1.0000] 完成。实际生成时长: 3933ms
[DEBUG] [Video-Cut] 片段2 [原:6400-10900ms] [目标:4500ms] [PTS:1.0000] 准备开始处理...
[DEBUG] [FFMPEG-CMD]:
ffmpeg -hide_banner -ignore_unknown -threads 0 -y -ss 00:00:06.400 -t 4.500000 -i D:/win-pyvideotrans-v3.98-329/tmp/11368/8a30adc7d9/novoice.mp4 -an -c:v libx264 -g 1 -preset veryfast -crf 20 -pix_fmt yuv420p -vf setpts=PTS -fps_mode vfr -t 4.500000 clip_2_1.000.mp4

[DEBUG] [Video-Cut] 片段2 [原:6400-10900ms] [目标:4500ms] [PTS:1.0000] 完成。实际生成时长: 4466ms
[DEBUG] [Video-Cut] 片段3 [原:10900-13560ms] [目标:2660ms] [PTS:1.0000] 准备开始处理...
[DEBUG] [FFMPEG-CMD]:
ffmpeg -hide_banner -ignore_unknown -threads 0 -y -ss 00:00:10.900 -t 2.660000 -i D:/win-pyvideotrans-v3.98-329/tmp/11368/8a30adc7d9/novoice.mp4 -an -c:v libx264 -g 1 -preset veryfast -crf 20 -pix_fmt yuv420p -vf setpts=PTS -fps_mode vfr -t 2.660000 clip_3_1.000.mp4

[DEBUG] [Video-Cut] 片段3 [原:10900-13560ms] [目标:2660ms] [PTS:1.0000] 完成。实际生成时长: 2633ms
[DEBUG] [Video-Cut] 片段4 [原:13560-14940ms] [目标:1380ms] [PTS:1.0000] 准备开始处理...
[DEBUG] [FFMPEG-CMD]:
ffmpeg -hide_banner -ignore_unknown -threads 0 -y -ss 00:00:13.560 -t 1.380000 -i D:/win-pyvideotrans-v3.98-329/tmp/11368/8a30adc7d9/novoice.mp4 -an -c:v libx264 -g 1 -preset veryfast -crf 20 -pix_fmt yuv420p -vf setpts=PTS -fps_mode vfr -t 1.380000 clip_4_1.000.mp4

[DEBUG] [Video-Cut] 片段4 [原:13560-14940ms] [目标:1380ms] [PTS:1.0000] 完成。实际生成时长: 1366ms
[DEBUG] [Video-Cut] 片段5 [原:14940-19020ms] [目标:4080ms] [PTS:1.0000] 准备开始处理...
[DEBUG] [FFMPEG-CMD]:
ffmpeg -hide_banner -ignore_unknown -threads 0 -y -ss 00:00:14.940 -t 4.080000 -i D:/win-pyvideotrans-v3.98-329/tmp/11368/8a30adc7d9/novoice.mp4 -an -c:v libx264 -g 1 -preset veryfast -crf 20 -pix_fmt yuv420p -vf setpts=PTS -fps_mode vfr -t 4.080000 clip_5_1.000.mp4

[DEBUG] [Video-Cut] 片段5 [原:14940-19020ms] [目标:4080ms] [PTS:1.0000] 完成。实际生成时长: 4033ms
[DEBUG] [Video-Cut] 片段6 [原:19020-23100ms] [目标:4559ms] [PTS:1.1174] 准备开始处理...
[DEBUG] [FFMPEG-CMD]:
ffmpeg -hide_banner -ignore_unknown -threads 0 -y -ss 00:00:19.020 -t 4.080000 -i D:/win-pyvideotrans-v3.98-329/tmp/11368/8a30adc7d9/novoice.mp4 -an -c:v libx264 -g 1 -preset veryfast -crf 20 -pix_fmt yuv420p -vf setpts=1.1224019607843136*PTS -fps_mode vfr -t 4.559000 clip_6_1.117.mp4

Floor #21 DeepSeek reply at 2 months ago

问题已定位。日志显示在“声音变速对齐阶段”，软件正在对视频进行切割和变速处理（setpts=1.1224019607843136*PTS 表示视频慢速），但在处理片段0时出现异常（[ERROR] [Video-Cut] 片段0 ... 处理异常），导致后续进程卡住。核心原因是视频切割或重新编码时，对第一段视频片段（起始时间为0）的处理出现了ffmpeg编码错误。解决方案：1. 禁用视频慢速处理：在主界面，取消勾选 视频慢速 选项。这是最直接的解决方法，因为错误发生在视频慢速处理阶段（PTS不等于1）。如果必须使用视频慢速，请继续尝试以下步骤。2. 修改视频输出设置：在 菜单 -> 工具 -> 高级选项 -> 视频输出控制 中，进行如下调整：输出视频压缩率：从 veryfast 改为 medium 或 fast。强制软编码视频？：勾选此项。视频合成cuda硬解码：取消勾选此项。修改后，关闭软件并重新处理任务。3. 检查原始视频编码：确保原始视频是兼容性最好的 H.264 (libx264) 编码的 MP4 文件。如果视频编码特殊（如HEVC/H.265, AV1），可能引起切割问题。可以使用格式转换工具先将其转为标准H.264 MP4。4. 处理单个文件测试：选择一个出现此问题的视频，单独进行处理，观察是否能通过此阶段。5. 查看完整错误信息：打开软件安装目录下的 logs 文件夹，找到最新的日志文件，搜索 [ERROR] [Video-Cut] 片段0 附近更详细的错误描述（可能包含ffmpeg的具体报错），以便进一步分析。如果以上步骤无效，可以尝试在高级选项中，将 输出视频质量控制 调高（例如从20改为23），以降低编码复杂度。请查阅相关文档：为何会出现声音、字幕、画面不同步

#3885 TaskCfgVTT(is_cuda=True, uuid='da4e9f224c', cache_folder='D:/win-pyvideotrans-v3.98-323/tmp/13292/da4e9f224c', target_di

21 Replies

请查阅相关文档：

请查阅相关文档：

请查阅相关文档：

Post Your Reply

Related resource