#4350 TaskCfgSTT(is_cuda=True, uuid='7818646aeb', cache_folder='E:/win-pyvideotrans-v3.99-428/tmp/13252/7818646aeb', target_di

2a09:bac5* Posted at: 2 months ago

语音识别阶段出错 [faster-whisper(本地)] Traceback (most recent call last):
File "videotrans\process\stt_fun.py", line 471, in faster_whisper
File "faster_whisper\transcribe.py", line 1851, in restore_speech_timestamps
File "faster_whisper\transcribe.py", line 1279, in generate_segments
File "faster_whisper\transcribe.py", line 1590, in add_word_timestamps
File "faster_whisper\transcribe.py", line 1709, in find_alignment
RuntimeError: cuBLAS failed with status CUBLAS_STATUS_NOT_SUPPORTED

Traceback (most recent call last):
File "videotrans\task\job.py", line 105, in run
File "videotrans\task\_speech2text.py", line 159, in recogn
File "videotrans\recognition\__init__.py", line 293, in run
File "videotrans\recognition\_base.py", line 143, in run
File "videotrans\recognition\_overall.py", line 33, in _exec
File "videotrans\recognition\_overall.py", line 105, in _faster
File "videotrans\configure\_base.py", line 289, in _new_process
RuntimeError: Traceback (most recent call last):
File "videotrans\process\stt_fun.py", line 471, in faster_whisper
File "faster_whisper\transcribe.py", line 1851, in restore_speech_timestamps
File "faster_whisper\transcribe.py", line 1279, in generate_segments
File "faster_whisper\transcribe.py", line 1590, in add_word_timestamps
File "faster_whisper\transcribe.py", line 1709, in find_alignment
RuntimeError: cuBLAS failed with status CUBLAS_STATUS_NOT_SUPPORTED
TaskCfgSTT(is_cuda=True, uuid='7818646aeb', cache_folder='E:/win-pyvideotrans-v3.99-428/tmp/13252/7818646aeb', target_dir='E:/win-pyvideotrans-v3.99-428/output/recogn', source_language=None, source_language_code=None, source_sub=None, source_wav=None, source_wav_output=None, target_language=None, target_language_code=None, target_sub='E:/win-pyvideotrans-v3.99-428/output/recogn/微信视频2026-04-29_000832_529.srt', target_wav=None, target_wav_output=None, name='C:/Users/Administrator/Downloads/微信视频2026-04-29_000832_529.mp4', noextname='微信视频2026-04-29_000832_529', basename='微信视频2026-04-29_000832_529.mp4', ext='mp4', dirname='C:/Users/Administrator/Downloads', shound_del_name=None, detect_language='zh-cn', recogn_type=0, model_name='medium', shibie_audio='E:/win-pyvideotrans-v3.99-428/tmp/13252/7818646aeb/微信视频2026-04-29_000832_529-1777529094.4861927.wav', remove_noise=False, enable_diariz=False, nums_diariz=0, rephrase=0, fix_punc=False)

=
system:Windows-10-10.0.26200-SP0
version:v3.99
frozen:True
language:zh
root_dir:E:/win-pyvideotrans-v3.99-428

Floor #1 DeepSeek reply at 2 months ago

该错误是由于 CUDA 加速与当前显卡（如 NVIDIA 50 系列）存在兼容性问题，cuBLAS 库不支持当前操作。常见于驱动版本过旧或 CUDA/cuDNN 配置不匹配。

解决方案：

彻底更新显卡驱动：前往 NVIDIA 官网下载安装最新版 Game Ready 或 Studio 驱动。
检查 CUDA 与 cuDNN 版本：本软件内置 CUDA 12.8，需确保已安装匹配的 cuDNN 9.11+，且环境变量正确。
临时关闭 CUDA 加速：取消主界面中的“CUDA 加速”勾选，改用 CPU 识别，验证是否为加速导致的问题。
修改高级参数：在菜单 工具/选项 -> 高级选项 -> 语音识别参数 中，将 CUDA数据类型 改为 int8（牺牲少量精度），并将 beam_size 和 best_of 均设为 1，降低显存占用。
更换模型：尝试使用更小的模型（如 small）或切换至 openai-whisper(本地) 渠道。

若问题依旧，请参照下方详细文档排查。

请查阅相关文档：

CUBLAS_STATUS_NOT_SUPPORTED faster-whisper 在50系显卡上加速遇到错误的解决办法

Floor #2 2a09:bac5* reply at 2 months ago

我的nvidia 驱动是595.79

Floor #3 DeepSeek reply at 2 months ago

驱动版本 595.79 属于较新的版本，但该错误可能仍与 50 系显卡的驱动或 CUDA 运行时兼容性有关。解决方案如下：

更新驱动至最新：前往 NVIDIA 官网下载并安装针对您显卡的最新 Game Ready 驱动，有时问题在最新版中已修复。
确认 cuDNN 安装：确保已安装 cuDNN 9.11 或更高版本，且其 bin、lib 目录已正确添加至系统环境变量。
临时关闭 CUDA 加速：取消勾选主界面的“CUDA 加速”选项，改用 CPU 进行识别，以验证是否为加速本身导致。
调整高级参数：在菜单 工具/选项 → 高级选项 → 语音识别参数 中，将 CUDA数据类型 设为 int8，beam_size 和 best_of 均设为 1。
更换模型或识别渠道：尝试使用 small 模型，或切换到 openai-whisper(本地) 渠道。

若问题依旧，请参照下方文档获取更详细的手动配置方法。

请查阅相关文档：

CUBLAS_STATUS_NOT_SUPPORTED faster-whisper 在50系显卡上加速遇到错误的解决办法

Floor #4 2a09:bac5* reply at 2 months ago

beam_size 和 best_of 是干嘛的

Floor #5 DeepSeek reply at 2 months ago

beam_size 和 best_of 是控制本地语音识别模型（如 faster-whisper）解码时搜索精度的参数。

beam_size：束搜索的宽度，数值越大，算法同时保留的候选结果越多，识别准确率越高，但显存占用也越大。
best_of：从多个独立束中选取最佳结果的数量，同样越大精度越高、资源消耗越多。

两者取值范围均为 1~5，当遇到显存不足或兼容性问题时，可将其降至 1 以最小化显存占用。

Floor #6 2a09:bac5* reply at 2 months ago

取消勾选去用CUDA，确实可以生成语音文本

Floor #7 DeepSeek reply at 2 months ago

已确认问题根源在于 CUDA 加速与当前显卡或环境的兼容性，而非识别功能本身。若仍希望开启 CUDA 加速以提升速度，请按顺序尝试：

先调整高级参数
打开 菜单 → 工具/选项 → 高级选项 → 语音识别参数，做以下修改：
- CUDA数据类型：改为 int8
- beam_size：设为 1
- best_of：设为 1
  保存后重新勾选主界面的“CUDA 加速”，再次执行识别。
验证 cuDNN 环境
确保 cuDNN 9.11+ 已正确安装，且其 bin、lib 目录已添加至系统环境变量。
考虑切换到 openai-whisper(本地) 渠道
该渠道同样支持 CUDA 加速，可能绕开 faster-whisper 的该特定错误。
参考专题文档
若以上步骤均无效，请查阅专门针对此错误的整理方案，内含更详细的排查步骤与驱动/依赖版本说明。

如果暂时无法启用 CUDA 加速，可继续关闭该选项使用 CPU 识别，等待后续软件更新或环境调整后再试。

请查阅相关文档：

CUBLAS_STATUS_NOT_SUPPORTED faster-whisper 在50系显卡上加速遇到错误的解决办法

#4350 TaskCfgSTT(is_cuda=True, uuid='7818646aeb', cache_folder='E:/win-pyvideotrans-v3.99-428/tmp/13252/7818646aeb', target_di

7 Replies

请查阅相关文档：

请查阅相关文档：

请查阅相关文档：

Post Your Reply

Related resource