#3804 TaskCfg(cache_folder='D:/Download/win-pyvideotrans-v3.95/tmp/16436/2c48d5ec91', target_dir='D:/Download/win-pyvideotrans

60.28* Posted at: 3 months ago

语音识别阶段出错 [faster-whisper(本地)] Traceback (most recent call last):
File "videotrans\process\stt_fun.py", line 176, in faster_whisper
File "faster_whisper\transcribe.py", line 689, in init
RuntimeError: CUDA failed with error out of memory

Traceback (most recent call last):
File "videotrans\task\job.py", line 106, in run
File "videotrans\task\_speech2text.py", line 156, in recogn
File "videotrans\recognition\__init__.py", line 276, in run
File "videotrans\recognition\_base.py", line 140, in run
File "videotrans\recognition\_overall.py", line 63, in _exec
File "videotrans\recognition\_overall.py", line 142, in _faster
File "videotrans\configure\_base.py", line 276, in _new_process
RuntimeError: Traceback (most recent call last):
File "videotrans\process\stt_fun.py", line 176, in faster_whisper
File "faster_whisper\transcribe.py", line 689, in init
RuntimeError: CUDA failed with error out of memory
TaskCfg(cache_folder='D:/Download/win-pyvideotrans-v3.95/tmp/16436/2c48d5ec91', target_dir='D:/Download/win-pyvideotrans-v3.95/output/recogn', remove_noise=False, is_separate=False, detect_language='auto', subtitle_language=None, source_language=None, target_language=None, source_language_code=None, target_language_code=None, source_sub=None, target_sub='D:/Download/win-pyvideotrans-v3.95/output/recogn/736de564bb7b731cd2399e0d44aabfa1.srt', source_wav=None, source_wav_output=None, target_wav=None, target_wav_output=None, subtitles='', novoice_mp4=None, noextname='736de564bb7b731cd2399e0d44aabfa1', shibie_audio='D:/Download/win-pyvideotrans-v3.95/tmp/16436/2c48d5ec91/736de564bb7b731cd2399e0d44aabfa1-1774512153.5263798.wav', targetdir_mp4=None, instrument=None, vocal=None, back_audio=None, background_music=None, app_mode='biaozhun', subtitle_type=0, volume='+0%', pitch='+0Hz', voice_rate='+0%', voice_role=None, copysrt_rawvideo=False, clear_cache=False, translate_type=None, tts_type=None, recogn_type=0, model_name='large-v3-turbo', voice_autorate=False, video_autorate=False, cuda=True, name='C:/Users/DAWN/Desktop/736de564bb7b731cd2399e0d44aabfa1.mp4', basename='736de564bb7b731cd2399e0d44aabfa1.mp4', ext='mp4', dirname='C:/Users/DAWN/Desktop', shound_del_name=None, uuid='2c48d5ec91', remove_silent_mid=False, align_sub_audio=True, enable_diariz=False, nums_diariz=0, rephrase=0, only_out_mp4=False, fix_punc=False, recogn2pass=False)

=
system:Windows-10-10.0.22621-SP0
version:v3.95
frozen:True
language:zh
root_dir:D:/Download/win-pyvideotrans-v3.95

Floor #1 DeepSeek reply at 3 months ago

语音识别阶段出现 CUDA 内存不足错误。这是因为您使用的 large-v3-turbo 模型对显存需求较高，而当前显卡的可用显存不足以加载模型。

请按以下步骤解决：

更换更小的模型：在主界面的语音识别渠道右侧，将模型从 large-v3-turbo 更换为 medium、small 或 base。large-v3 系列模型通常需要 10GB 以上显存。
调整高级设置：如果必须使用大模型，请进入 菜单 -> 工具 -> 高级选项，在“语音识别参数”区域进行如下调整以降低显存占用：
- CUDA数据类型：将 float32 改为 float16 或 int8。
- 识别准确度beam_size：将 5 改为 1。
- 识别准确度best_of：将 5 改为 1。
- 启用上下文感知：确保此项为 false（不勾选）。
检查并发任务：如果您正在批量处理多个视频，请确保 菜单 -> 工具 -> 高级选项 中的 GPU同时任务数[重启生效] 设置为 1，并勾选 批量翻译时强制串行 以避免多个任务同时占用显存。
关闭二次识别：如果主界面右上角的“二次识别”选项被勾选，请取消勾选。该功能会在配音后再次进行语音识别，可能与前一个识别任务同时运行，导致显存需求翻倍。

请查阅相关文档：

总是提示显存不足

#3804 TaskCfg(cache_folder='D:/Download/win-pyvideotrans-v3.95/tmp/16436/2c48d5ec91', target_dir='D:/Download/win-pyvideotrans

1 Replies

请查阅相关文档：

Post Your Reply

Related resource