#3576 Traceback (most recent call last): File "videotrans\task\job.py", line 105, in run File "videotrans\task\trans_create.

172.238* Posted at: 4 hours ago 👁9

Traceback (most recent call last):
File "videotrans\task\job.py", line 105, in run
File "videotrans\task\trans_create.py", line 353, in recogn
File "videotrans\recognition\__init__.py", line 265, in run
File "videotrans\recognition\_base.py", line 143, in run
File "videotrans\recognition\_overall.py", line 33, in _exec
File "videotrans\recognition\_overall.py", line 105, in _faster
File "videotrans\configure\_base.py", line 294, in _new_process
RuntimeError: 出错了,可能内存或显存不足
A child process terminated abruptly, the process pool is not usable anymore
[DEBUG] 最终配置信息:self.cfg=TaskCfgVTT(is_cuda=True, uuid='7de29d10af', cache_folder='D:/videotrans/tmp/27368/7de29d10af', target_dir='C:/Users/Administrator/Desktop/_video_out/s002-女体化催眠誘導-mp3', source_language='日语', source_language_code='ja', source_sub='C:/Users/Administrator/Desktop/_video_out/s002-女体化催眠誘導-mp3/ja.srt', source_wav='D:/videotrans/tmp/27368/7de29d10af/ja.wav', source_wav_output='C:/Users/Administrator/Desk
......
_video_out/s002-女体化催眠誘導-mp3/s002-女体化催眠誘導.mp4', novoice_mp4='D:/videotrans/tmp/27368/24d545e5f0/novoice.mp4', is_separate=False, instrument=None, vocal=None, back_audio='', clear_cache=False, background_music=None, subtitle_type=0, only_out_mp4=False, recogn2pass=False, output_srt=0, copysrt_rawvideo=False)

[DEBUG] [recognition]__init__:kwargs={'detect_language': 'ja', 'audio_file': 'D:/videotrans/tmp/27368/24d545e5f0/ja.wav', 'cache_folder': 'D:/videotrans/tmp/27368/24d545e5f0', 'model_name': 'large-v3', 'uuid': '24d545e5f0', 'is_cuda': True, 'subtitle_type': 0, 'recogn_type': 0, 'max_speakers': -1, 'llm_post': True, 'recogn2pass': False}
[DEBUG] BaseRecogn 初始化

[DEBUG] [语音识别]渠道0,large-v3:共耗时:0s
[WARNING] 读取进程间日志文件出错,可忽略:[Errno 2] No such file or directory: 'D:\videotrans\tmp\27368\24d545e5f0\faster-ja-1773278531.7862284.log'
[WARNING] 读取进程间日志文件出错,可忽略:[Errno 2] No such file or directory: 'D:\videotrans\tmp\27368\24d545e5f0\faster-ja-1773278531.7862284.log'
等待 uuid_signal 线程退出
正在等待线程 PrepareVideo 结束...
正在等待线程 SpeechToText 结束...
正在等待线程 DiarizSpeaker 结束...
正在等待线程 TranslationSRT 结束...
正在等待线程 DubbingSrt 结束...
正在等待线程 AlignVieoAudioSrt 结束...
正在等待线程 AssembVideoAudioSrt 结束...
正在等待线程 TaskDone 结束...
Successfully killed ffmpeg processes using taskkill


Application started at 2026-03-12 09:49:14

First searching GPU...
[DEBUG] 返回缓存的编解码器 Windows-264: h264_nvenc
[DEBUG] 返回缓存的编解码器 Windows-265: hevc_nvenc
Found 1 GPUs, cost=1s
start workers...
process_max_gpu=1
multi_gpus=False
Concurrent task_nums=1
process_max=0
start 8 jobs
ended workers
[DEBUG] 最终配置信息:self.cfg=TaskCfgVTT(is_cuda=True, uuid='b302d9d34b', cache_folder='D:/videotrans/tmp/27416/b302d9d34b', target_dir='C:/Users/Administrator/Desktop/_video_out/s002-女体化催眠誘導-mp3', source_language='日语', source_language_code='ja', source_sub='C:/Users/Administrator/Desktop/_video_out/s002-女体化催眠誘導-mp3/ja.srt', source_wav='D:/videotrans/tmp/27416/b302d9d34b/ja.wav', source_wav_output='C:/Users/Administrator/Desktop/_video_out/s002-女体化催眠誘導-mp3/ja.m4a', target_language='简体中文', target_language_code='zh-cn', target_sub='C:/Users/Administrator/Desktop/_video_out/s002-女体化催眠誘導-mp3/zh-cn.srt', target_wav='D:/videotrans/tmp/27416/b302d9d34b/target.wav', target_wav_output='C:/Users/Administrator/Desktop/_video_out/s002-女体化催眠誘導-mp3/zh-cn.m4a', name='C:/Users/Administrator/Desktop/s002-女体化催眠誘導.mp3', noextname='s002-女体化催眠誘導', basename='s002-女体化催眠誘導.mp3', ext='mp3', dirname='C:/Users/Administrator/Desktop', shound_del_name=None, translate_type=0, tts_type=0, volume='+0%', pitch='+0Hz', voice_rate='+0%', voice_role='Xiaoxiao(Female/CN)', voice_autorate=False, video_autorate=False, remove_silent_mid=False, align_sub_audio=False, detect_language='ja', recogn_type=0, model_name='large-v3', shibie_audio=None, remove_noise=False, enable_diariz=False, nums_diariz=0, rephrase=1, fix_punc=False, subtitle_language=None, app_mode='biaozhun', subtitles='', targetdir_mp4='C:/Users/Administrator/Desktop/_video_out/s002-女体化催眠誘導-mp3/s002-女体化催眠誘導.mp4', novoice_mp4='D:/videotrans/tmp/27416/b302d9d34b/novoice.mp4', is_separate=False, instrument=None, vocal=None, back_audio='', clear_cache=False, background_music=None, subtitle_type=0, only_out_mp4=False, recogn2pass=False, output_srt=0, copysrt_rawvideo=False)

[DEBUG] [recognition]__init__:kwargs={'detect_language': 'ja', 'audio_file': 'D:/videotrans/tmp/27416/b302d9d34b/ja.wav', 'cache_folder': 'D:/videotrans/tmp/27416/b302d9d34b', 'model_name': 'large-v3', 'uuid': 'b302d9d34b', 'is_cuda': True, 'subtitle_type': 0, 'recogn_type': 0, 'max_speakers': -1, 'llm_post': True, 'recogn2pass': False}
[DEBUG] BaseRecogn 初始化

[DEBUG] GPU进程池:max_workers=1
[DEBUG] faster-whisper模式下,对large-v3模型返回的断句结果重新修正
[DEBUG] [语音识别]渠道0,large-v3:共耗时:258s

1 Replies

这是由于系统内存或显存不足,导致 faster-whisper 语音识别进程崩溃。

根据日志显示,您使用了 faster-whisper(本地) 渠道的 large-v3 模型,并启用了 CUDA 加速。该模型对显存和内存要求较高。错误信息 RuntimeError: 出错了,可能内存或显存不足A child process terminated abruptly, the process pool is not usable anymore 明确指出了资源不足的问题。

解决方案:

  1. 降低模型要求

    • 在语音识别渠道的下拉列表中,将模型从 large-v3 更换为更小的模型,例如 large-v2mediumsmalllarge-v3 模型需要至少 10GB 显存或 16GB 内存。
  2. 优化 CUDA 设置

    • 菜单 -> 工具 -> 高级选项 -> 语音识别参数 中,进行以下调整:

      • CUDA 数据类型:从 default 改为 int8。这会降低精度但大幅减少显存占用。
      • 识别准确度 beam_size识别准确度 best_of:将这两个值从默认的 5 降低到 1 或 2,以减少计算量。
      • 启用上下文感知:确保此项未勾选,以节省 GPU 资源。
  3. 调整高级选项

    • 菜单 -> 工具 -> 高级选项 -> 通用设置 中:

      • GPU同时任务数[重启生效]:确保此值为 1(默认值)。如果您的显卡显存小于 20GB,切勿调高此值。
      • 最大进程数[重启生效]:可以适当降低此值(例如设置为 CPU 核心数的一半),以减少总体内存压力。修改后需要重启软件。
  4. 检查系统资源

    • 在处理任务时,打开任务管理器,查看“性能”选项卡中的“内存”和“GPU”使用情况。确认是否有其他程序占用了大量内存或显存,如有请先关闭。
  5. (备选)使用其他语音识别渠道

    • 对于日语视频,知识库推荐使用 Huggingface_ASR 渠道下的 reazon-research/japanese-wav2vec2-large-rs35kh 模型,该模型可能对日语有更好的优化且资源占用不同,可以尝试切换。

如果以上调整后问题依旧,请提供您的显卡型号和显存大小,以及系统内存大小,以便进一步分析。

请查阅相关文档:

Post Your Reply