用了好几天软件,成功处理了几十个英语原声视频配中文双语字幕。中间出错无数也看了之前的建议,我有个非常大的疑问,请教开发者:
我一般的工作是10个视频一个文件夹一起处理,每个视频不超过30分钟的英语原文,然后不需要配音,只是用faster-whisper的large-v3-turbo模型翻译,然后合并生成带中英双语字幕的最终视频。
我机器128G内存,满血的4090 24G显卡,然后并行处理2 GPU并行1,大模型flote 16 等等,应该已经降低了内存显存消耗。然后每次运行要么重启电脑,要么清空缓存。可是为什么每次处理基本都有4-5个,也就是40%-50%的视频出错,显示“语音识别阶段出错 [faster-whisper(本地)] 出错了,可能内存或显存不足 [GPU0]
Traceback (most recent call last):
File "videotrans\configure\_base.py", line 281, in _new_process
File "videotrans\process\signelobj.py", line 80, in submit_task_gpu
File "concurrent\futures\process.py", line 720, in submit”
然后监控cuda和GPU,也都从来没用用满过,所以还有什么改进的方法么?