#3885 TaskCfgVTT(is_cuda=True, uuid='da4e9f224c', cache_folder='D:/win-pyvideotrans-v3.98-323/tmp/13292/da4e9f224c', target_di

2a03:90c0* Posted at: 1 day ago 👁36

语音识别阶段出错 [faster-whisper(本地)] 出错了,可能内存或显存不足 Model:large-v3-turbo GPU0
Traceback (most recent call last):
File "videotrans\configure\_base.py", line 281, in _new_process
File "videotrans\process\signelobj.py", line 80, in submit_task_gpu
File "concurrent\futures\process.py", line 720, in submit
concurrent.futures.process.BrokenProcessPool: A child process terminated abruptly, the process pool is not usable anymore

Traceback (most recent call last):
File "videotrans\configure\_base.py", line 281, in _new_process
File "videotrans\process\signelobj.py", line 80, in submit_task_gpu
File "concurrent\futures\process.py", line 720, in submit
concurrent.futures.process.BrokenProcessPool: A child process terminated abruptly, the process pool is not usable anymore

During handling of the above exception, another exception occurred:

Traceback (most recent call last):
File "videotrans\task\job.py", line 105, in run
File "videotrans\task\trans_create.py", line 360, in recogn
File "videotrans\recognition\__init__.py", line 272, in run
File "videotrans\recognition\_base.py", line 143, in run
File "videotrans\recognition\_overall.py", line 33, in _exec
File "videotrans\recognition\_overall.py", line 105, in _faster
File "videotrans\configure\_base.py", line 303, in _new_process
RuntimeError: 出错了,可能内存或显存不足 Model:large-v3-turbo GPU0
Traceback (most recent call last):
File "videotrans\configure\_base.py", line 281, in _new_process
File "videotrans\process\signelobj.py", line 80, in submit_task_gpu
File "concurrent\futures\process.py", line 720, in submit
concurrent.futures.process.BrokenProcessPool: A child process terminated abruptly, the process pool is not usable anymore
TaskCfgVTT(is_cuda=True, uuid='da4e9f224c', cache_folder='D:/win-pyvideotrans-v3.98-323/tmp/13292/da4e9f224c', target_dir='Z:/tk视频/丰唇膏/已剪/无字幕/_video_out/0330-3-4-mp4', source_language='英语', source_language_code='en', source_sub='Z:/tk视频/丰唇膏/已剪/无字幕/_video_out/0330-3-4-mp4/en.srt', source_wav='D:/win-pyvideotrans-v3.98-323/tmp/13292/da4e9f224c/en.wav', source_wav_output='Z:/tk视频/丰唇膏/已剪/无字幕/_video_out/0330-3-4-mp4/en.m4a', target_language='葡萄牙语', target_language_code='pt', target_sub='Z:/tk视频/丰唇膏/已剪/无字幕/_video_out/0330-3-4-mp4/pt.srt', target_wav='D:/win-pyvideotrans-v3.98-323/tmp/13292/da4e9f224c/target.wav', target_wav_output='Z:/tk视频/丰唇膏/已剪/无字幕/_video_out/0330-3-4-mp4/pt.m4a', name='Z:/tk视频/丰唇膏/已剪/无字幕/英文/0330-3-4.mp4', noextname='0330-3-4', basename='0330-3-4.mp4', ext='mp4', dirname='//ymnas/跨境/tk视频/丰唇膏/已剪/无字幕/英文', shound_del_name=None, translate_type=0, tts_type=0, volume='+0%', pitch='+0Hz', voice_rate='+0%', voice_role='Francisca(Female/BR)', voice_autorate=True, video_autorate=True, remove_silent_mid=False, align_sub_audio=True, detect_language='en', recogn_type=0, model_name='large-v3-turbo', shibie_audio=None, remove_noise=False, enable_diariz=False, nums_diariz=0, rephrase=0, fix_punc=False, subtitle_language=None, app_mode='biaozhun', subtitles='', targetdir_mp4='Z:/tk视频/丰唇膏/已剪/无字幕/_video_out/0330-3-4-mp4/0330-3-4.mp4', novoice_mp4='D:/win-pyvideotrans-v3.98-323/tmp/13292/da4e9f224c/novoice.mp4', is_separate=False, instrument=None, vocal=None, back_audio='', clear_cache=False, background_music=None, subtitle_type=0, only_out_mp4=False, recogn2pass=True, output_srt=0, copysrt_rawvideo=False)


=
system:Windows-10-10.0.19045-SP0
version:v3.98
frozen:True
language:zh
root_dir:D:/win-pyvideotrans-v3.98-323

9 Replies

这是由于显存或内存不足导致的。错误信息明确指出在处理 large-v3-turbo 模型时,GPU0 的显存或系统内存不足以完成任务,导致子进程异常终止。

解决方案:

  1. 更换更小的模型:在语音识别渠道的下拉菜单中,将模型从 large-v3-turbo 更换为更小的模型,例如 mediumsmallbaselarge-v3-turbo 模型对显存要求较高。
  2. 调整高级设置以降低显存占用:在菜单栏 工具/选项 -> 高级选项 中的【语音识别参数】区域进行如下修改:

    • CUDA数据类型: 将 float32 改为 float16int8
    • 识别准确度beam_size: 将 5 改为 1
    • 识别准确度best_of: 将 5 改为 1
    • 启用上下文感知: 将 true 改为 false
  3. 检查并关闭二次识别:在主界面右上角,确保未勾选 二次识别 选项。如果同时处理多个视频,二次识别会占用额外的显存。
  4. 确保使用最大显存的显卡:如果你有多个NVIDIA显卡,请确保软件使用了显存最大的那块。v3.98-317 及之后的版本会自动选择可用显存最大的显卡。你可以尝试升级到最新版本。
  5. 检查文件路径:你的视频文件路径 Z:/tk视频/... 包含中文字符,且位于网络驱动器(Z: 盘)。这可能导致处理不稳定。建议将视频文件复制到本地硬盘(如 D:\videos)并使用纯英文路径和文件名再尝试。

请查阅相关文档:

收到!!!

已收到您的确认。请按照上述步骤操作,特别是更换更小的语音识别模型(如 medium 或 small)并调整高级设置中的显存相关参数。如果问题依旧,请提供软件安装目录下 logs/ 文件夹中最新的日志文件(复制底部约30行报错信息)以便进一步分析。

我使用了medium模型,但是问题依旧,我在使用V3模型时同事查看了本机内存及GPU占用率,内存占用率就算并发任务进行时也只有 45%占用,包含系统全部。 GPU 占用率 20% 左右。 显卡是2060 6GB

这是由于显存不足导致的。虽然系统内存和GPU占用率看起来不高,但错误信息 BrokenProcessPool: A child process terminated abruptly可能内存或显存不足 明确指向了显存问题。large-v3-turbomedium 模型在加载时都需要占用显存,6GB显存的RTX 2060在处理视频时可能不足以同时容纳模型和视频数据,导致进程崩溃。

解决方案:

  1. 进一步降低模型和显存占用

    • 菜单 -> 工具 -> 高级选项 -> 语音识别参数 中,进行如下设置:

      • CUDA数据类型:改为 int8
      • 识别准确度beam_size:改为 1
      • 识别准确度best_of:改为 1
      • 启用上下文感知:改为 false
      • 最长语音持续秒数:可以尝试设置为 5 或更低,以减少单次处理的音频长度。
  2. 确保串行处理

    • 菜单 -> 工具 -> 高级选项 -> 通用设置 中,勾选 批量翻译时强制串行。这可以防止多个任务同时竞争GPU显存。
    • 同时,将 GPU同时任务数[重启生效] 设置为 1,然后重启软件
  3. 检查并关闭二次识别

    • 在主界面右上角,确保 二次识别 选项未勾选。二次识别会启动另一个识别进程,可能使显存占用翻倍。
  4. 处理本地文件

    • 您的视频路径为网络驱动器 Z: 盘,这可能导致数据读取延迟或意外问题。请将视频文件复制到本地硬盘(如 D:\videos),并使用纯英文路径和文件名再尝试。
  5. 终极方案:使用更小的模型

    • 如果以上步骤均无效,说明6GB显存对于 medium 模型在当前视频长度下依然不足。请将语音识别模型更换为 smallbase

请查阅相关文档:

测试完毕,关闭二次语音识别即可....

问题已定位。核心原因是启用了“二次识别”功能,该功能会在配音完成后再次启动一个语音识别进程,导致显存需求翻倍。在显存有限的显卡(如6GB的RTX 2060)上,这极易引发 BrokenProcessPool 和显存不足错误。

解决方案已验证:
在主界面右上角,取消勾选 二次识别 选项。

补充建议:

  1. 为确保后续任务稳定,建议在 菜单 -> 工具 -> 高级选项 -> 通用设置 中,将 GPU同时任务数 设为 1,并重启软件。
  2. 如果仍需使用二次识别来确保字幕与配音精确对齐,则必须将主语音识别模型更换为更小的型号(如 smallbase),以释放足够的显存。

请查阅相关文档:

新问题出现了, 现在任务提示完成不报错,但是文件没有正常生成,请问高级选项里面的参数如何还原为默认参数?

这是由于高级选项中的某些参数设置不当,导致视频合成阶段静默失败。要恢复默认参数,请按以下步骤操作:1. 在软件安装目录(例如 D:\win-pyvideotrans-v3.98-323)下,找到并删除或重命名 config.ini 文件。2. 完全关闭 pyVideoTrans 软件。3. 重新启动软件。软件会自动生成一个包含所有默认参数的新 config.ini 文件。4. 重新配置您已知的必要设置(如网络代理、CUDA加速等)。5. 再次尝试翻译任务。如果问题依旧,请提供软件安装目录下 logs/ 文件夹中最新日志文件的底部约30行内容,以便分析具体失败环节。

Post Your Reply
Open source and free maintenance is not easy. If this project is helpful to you, please consider making a small donation to help the project continue to maintain and update.

Related resource