#4350 TaskCfgSTT(is_cuda=True, uuid='7818646aeb', cache_folder='E:/win-pyvideotrans-v3.99-428/tmp/13252/7818646aeb', target_di

2a09:bac5* Posted at: 2 hours ago 👁14

语音识别阶段出错 [faster-whisper(本地)] Traceback (most recent call last):
File "videotrans\process\stt_fun.py", line 471, in faster_whisper
File "faster_whisper\transcribe.py", line 1851, in restore_speech_timestamps
File "faster_whisper\transcribe.py", line 1279, in generate_segments
File "faster_whisper\transcribe.py", line 1590, in add_word_timestamps
File "faster_whisper\transcribe.py", line 1709, in find_alignment
RuntimeError: cuBLAS failed with status CUBLAS_STATUS_NOT_SUPPORTED

Traceback (most recent call last):
File "videotrans\task\job.py", line 105, in run
File "videotrans\task\_speech2text.py", line 159, in recogn
File "videotrans\recognition\__init__.py", line 293, in run
File "videotrans\recognition\_base.py", line 143, in run
File "videotrans\recognition\_overall.py", line 33, in _exec
File "videotrans\recognition\_overall.py", line 105, in _faster
File "videotrans\configure\_base.py", line 289, in _new_process
RuntimeError: Traceback (most recent call last):
File "videotrans\process\stt_fun.py", line 471, in faster_whisper
File "faster_whisper\transcribe.py", line 1851, in restore_speech_timestamps
File "faster_whisper\transcribe.py", line 1279, in generate_segments
File "faster_whisper\transcribe.py", line 1590, in add_word_timestamps
File "faster_whisper\transcribe.py", line 1709, in find_alignment
RuntimeError: cuBLAS failed with status CUBLAS_STATUS_NOT_SUPPORTED
TaskCfgSTT(is_cuda=True, uuid='7818646aeb', cache_folder='E:/win-pyvideotrans-v3.99-428/tmp/13252/7818646aeb', target_dir='E:/win-pyvideotrans-v3.99-428/output/recogn', source_language=None, source_language_code=None, source_sub=None, source_wav=None, source_wav_output=None, target_language=None, target_language_code=None, target_sub='E:/win-pyvideotrans-v3.99-428/output/recogn/微信视频2026-04-29_000832_529.srt', target_wav=None, target_wav_output=None, name='C:/Users/Administrator/Downloads/微信视频2026-04-29_000832_529.mp4', noextname='微信视频2026-04-29_000832_529', basename='微信视频2026-04-29_000832_529.mp4', ext='mp4', dirname='C:/Users/Administrator/Downloads', shound_del_name=None, detect_language='zh-cn', recogn_type=0, model_name='medium', shibie_audio='E:/win-pyvideotrans-v3.99-428/tmp/13252/7818646aeb/微信视频2026-04-29_000832_529-1777529094.4861927.wav', remove_noise=False, enable_diariz=False, nums_diariz=0, rephrase=0, fix_punc=False)


=
system:Windows-10-10.0.26200-SP0
version:v3.99
frozen:True
language:zh
root_dir:E:/win-pyvideotrans-v3.99-428

7 Replies

该错误是由于 CUDA 加速与当前显卡(如 NVIDIA 50 系列)存在兼容性问题,cuBLAS 库不支持当前操作。常见于驱动版本过旧或 CUDA/cuDNN 配置不匹配。

解决方案:

  1. 彻底更新显卡驱动:前往 NVIDIA 官网下载安装最新版 Game Ready 或 Studio 驱动。
  2. 检查 CUDA 与 cuDNN 版本:本软件内置 CUDA 12.8,需确保已安装匹配的 cuDNN 9.11+,且环境变量正确。
  3. 临时关闭 CUDA 加速:取消主界面中的“CUDA 加速”勾选,改用 CPU 识别,验证是否为加速导致的问题。
  4. 修改高级参数:在菜单 工具/选项 -> 高级选项 -> 语音识别参数 中,将 CUDA数据类型 改为 int8(牺牲少量精度),并将 beam_sizebest_of 均设为 1,降低显存占用。
  5. 更换模型:尝试使用更小的模型(如 small)或切换至 openai-whisper(本地) 渠道。

若问题依旧,请参照下方详细文档排查。

请查阅相关文档:

我的nvidia 驱动是595.79

驱动版本 595.79 属于较新的版本,但该错误可能仍与 50 系显卡的驱动或 CUDA 运行时兼容性有关。解决方案如下:

  1. 更新驱动至最新:前往 NVIDIA 官网下载并安装针对您显卡的最新 Game Ready 驱动,有时问题在最新版中已修复。
  2. 确认 cuDNN 安装:确保已安装 cuDNN 9.11 或更高版本,且其 binlib 目录已正确添加至系统环境变量。
  3. 临时关闭 CUDA 加速:取消勾选主界面的“CUDA 加速”选项,改用 CPU 进行识别,以验证是否为加速本身导致。
  4. 调整高级参数:在菜单 工具/选项高级选项语音识别参数 中,将 CUDA数据类型 设为 int8beam_sizebest_of 均设为 1
  5. 更换模型或识别渠道:尝试使用 small 模型,或切换到 openai-whisper(本地) 渠道。

若问题依旧,请参照下方文档获取更详细的手动配置方法。

请查阅相关文档:

beam_size 和 best_of 是干嘛的

beam_size 和 best_of 是控制本地语音识别模型(如 faster-whisper)解码时搜索精度的参数。

  • beam_size:束搜索的宽度,数值越大,算法同时保留的候选结果越多,识别准确率越高,但显存占用也越大。
  • best_of:从多个独立束中选取最佳结果的数量,同样越大精度越高、资源消耗越多。

两者取值范围均为 1~5,当遇到显存不足或兼容性问题时,可将其降至 1 以最小化显存占用。

取消勾选去用CUDA,确实可以生成语音文本

已确认问题根源在于 CUDA 加速与当前显卡或环境的兼容性,而非识别功能本身。若仍希望开启 CUDA 加速以提升速度,请按顺序尝试:

  1. 先调整高级参数
    打开 菜单 → 工具/选项 → 高级选项 → 语音识别参数,做以下修改:

    • CUDA数据类型:改为 int8
    • beam_size:设为 1
    • best_of:设为 1
      保存后重新勾选主界面的“CUDA 加速”,再次执行识别。
  2. 验证 cuDNN 环境
    确保 cuDNN 9.11+ 已正确安装,且其 binlib 目录已添加至系统环境变量。
  3. 考虑切换到 openai-whisper(本地) 渠道
    该渠道同样支持 CUDA 加速,可能绕开 faster-whisper 的该特定错误。
  4. 参考专题文档
    若以上步骤均无效,请查阅专门针对此错误的整理方案,内含更详细的排查步骤与驱动/依赖版本说明。

如果暂时无法启用 CUDA 加速,可继续关闭该选项使用 CPU 识别,等待后续软件更新或环境调整后再试。

请查阅相关文档:

Post Your Reply
Open source and free maintenance is not easy. If this project is helpful to you, please consider making a small donation to help the project continue to maintain and update.

Related resource