#3922 TaskCfgSTT(is_cuda=False, uuid='c86c99fd0d', cache_folder='D:/win-pyvideotrans-v3.98-0401/tmp/16060/c86c99fd0d', target_

163.125* Posted at: 3 months ago

语音识别阶段出错 [faster-whisper(本地)] Traceback (most recent call last):
File "videotrans\process\stt_fun.py", line 346, in faster_whisper
File "faster_whisper\transcribe.py", line 689, in init
ValueError: Requested bfloat16 compute type, but the target device or backend do not support efficient bfloat16 computation.

Traceback (most recent call last):
File "videotrans\task\job.py", line 105, in run
File "videotrans\task\_speech2text.py", line 159, in recogn
File "videotrans\recognition\__init__.py", line 284, in run
File "videotrans\recognition\_base.py", line 143, in run
File "videotrans\recognition\_overall.py", line 33, in _exec
File "videotrans\recognition\_overall.py", line 105, in _faster
File "videotrans\configure\_base.py", line 289, in _new_process
RuntimeError: Traceback (most recent call last):
File "videotrans\process\stt_fun.py", line 346, in faster_whisper
File "faster_whisper\transcribe.py", line 689, in init
ValueError: Requested bfloat16 compute type, but the target device or backend do not support efficient bfloat16 computation.
TaskCfgSTT(is_cuda=False, uuid='c86c99fd0d', cache_folder='D:/win-pyvideotrans-v3.98-0401/tmp/16060/c86c99fd0d', target_dir='D:/win-pyvideotrans-v3.98-0401/output/recogn', source_language=None, source_language_code=None, source_sub=None, source_wav=None, source_wav_output=None, target_language=None, target_language_code=None, target_sub='D:/win-pyvideotrans-v3.98-0401/output/recogn/Tiffani Time - Tiffani And Benfit - Fit Blonde Hotwife Gets BBC.srt', target_wav=None, target_wav_output=None, name='D:/360Downloads/Tiffani Time - Tiffani And Benfit - Fit Blonde Hotwife Gets BBC.mp4', noextname='Tiffani Time - Tiffani And Benfit - Fit Blonde Hotwife Gets BBC', basename='Tiffani Time - Tiffani And Benfit - Fit Blonde Hotwife Gets BBC.mp4', ext='mp4', dirname='D:/360Downloads', shound_del_name=None, detect_language='en', recogn_type=0, model_name='base', shibie_audio='D:/win-pyvideotrans-v3.98-0401/tmp/16060/c86c99fd0d/Tiffani Time - Tiffani And Benfit - Fit Blonde Hotwife Gets BBC-1775198159.3919365.wav', remove_noise=False, enable_diariz=False, nums_diariz=0, rephrase=0, fix_punc=False)

=
system:Windows-10-10.0.19045-SP0
version:v3.98
frozen:True
language:zh
root_dir:D:/win-pyvideotrans-v3.98-0401

Floor #1 DeepSeek reply at 3 months ago

这是由于 faster-whisper 模型尝试使用 bfloat16 计算类型，但你的硬件或 CUDA 环境不支持该数据类型导致的。

解决方案：

进入软件顶部菜单栏：工具/选项 -> 高级选项。
在 【语音识别参数】 区域，找到 CUDA数据类型 选项。
将其从默认的 default 或 bfloat16 修改为 float16 或 int8。
保存设置并重新运行语音识别任务。

如果修改后问题依旧，请检查 CUDA 环境：

确认已正确安装 NVIDIA 显卡驱动、CUDA 12.8 和 cuDNN 9.x。
在 CMD 中输入 nvcc -V 和 nvidia-smi 验证版本和显卡状态。
如果未安装 CUDA 或版本过低，请参考相关文档进行安装。

请查阅相关文档：

windows上安装CUDA12.8和cuDNN9.11

#3922 TaskCfgSTT(is_cuda=False, uuid='c86c99fd0d', cache_folder='D:/win-pyvideotrans-v3.98-0401/tmp/16060/c86c99fd0d', target_

1 Replies

请查阅相关文档：

Post Your Reply

Related resource