#1446 软件只支持CUDA 12.8? 已经安装了13.0 使用时GPU没有占用

109.122* Posted at: 4 hours ago 👁22

软件只支持CUDA 12.8? 已经安装了13.0 使用时GPU没有占用

11 Replies

根据官方信息,pyVideoTrans 使用的 faster-whisper 库通常对 CUDA 版本有较好的向下兼容性。您已安装 CUDA 13.0,理论上应能正常工作。

GPU 未被占用的可能原因及解决方案如下:

  1. 未正确勾选 CUDA 加速选项

    • 在软件主界面的“翻译视频和音频”功能下,开始执行任务前,请务必勾选 “CUDA加速” 复选框。
  2. CUDA 环境未正确配置

    • 请确认您安装的是 NVIDIA 显卡驱动CUDA Toolkit,而不仅仅是 Visual Studio 中的编译工具。
    • 打开命令提示符 (CMD),输入 nvcc --version 检查 CUDA 版本是否能被系统识别。如果无法识别,可能需要将 CUDA 的安装路径(如 C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v13.0\bin)添加到系统的 PATH 环境变量中。
  3. PyTorch 与 CUDA 版本不匹配

    • 软件内置的 PyTorch 可能并非针对 CUDA 13.0 编译。一个常见的解决方法是,在软件根目录下,找到并进入 venv 文件夹,然后在此路径下打开 CMD,执行以下命令来安装与您 CUDA 13.0 兼容的 PyTorch:

      pip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu121
    • 注意:上述命令安装的是 CUDA 12.1 版本的 PyTorch,但 CUDA 12.1 与 13.0 通常是兼容的。如果此方法无效,可能需要寻找特定于 CUDA 13.0 的 wheel 包。
  4. 显卡硬件限制

    • 请确认您的 NVIDIA 显卡支持 CUDA。较老的显卡可能无法运行。

如果以上步骤仍无法解决问题,请提供软件运行时 videotrans/logs/ 目录下的错误日志文件,以便进行更精确的分析。


Application started at 2025-11-13 17:47:52

2025-11-13 17:47:52,319 - INFO - 返回缓存的编解码器 Windows-264: libx264
self.proxy_str='http://127.0.0.1:7897'
2025-11-13 17:49:15,178 - INFO - 返回缓存的编解码器 Windows-264: libx264
2025-11-13 17:49:15,178 - INFO - 未找到或未选择硬件编码器,将使用软件编码。
self.proxy_str='http://127.0.0.1:7897'
2025-11-13 17:49:38,630 - INFO - 开始创建 pid:self.pidfile='C:/Users/Liuke/Downloads/win-videotrans-v3.83/tmp15436/15000.lock'
2025-11-13 17:50:33,366 - INFO - Processing audio with duration 15:38.597
2025-11-13 17:50:34,810 - INFO - VAD filter removed 13:12.901 of audio
2025-11-13 17:50:34,810 - DEBUG - VAD filter kept the following audio segments: [00:04.128 -> 00:04.256], [00:04.608 -> 00:05.536], [00:05.888 -> 00:06.272], [00:07.072 -> 00:08.320], [00:08.736 -> 00:12.800], [00:13.504 -> 00:14.624], [00:15.200 -> 00:16.640], [00:17.408 -> 00:18.144],

从您提供的日志片段来看,问题核心在于 语音识别阶段的 VAD (语音活动检测) 过滤过于激进,导致大量有效语音被误判为静音而移除(VAD filter removed 13:12.901 of audio),这直接造成最终字幕和配音大量缺失。

解决方案:调整 VAD 参数

  1. 在软件顶部菜单栏,选择 工具/选项 -> 高级选项
  2. 找到 “faster/openai语音识别调整” 区域,进行如下修改:

    • 语音阈值 (speech_threshold):从默认的 0.5 调低0.30.2。这会使检测对语音更敏感。
    • 最短语音持续时间/毫秒 (min_speech_duration_ms):确保此项为 0,避免过短的语音被过滤。
    • 静音分割毫秒 (min_silence_duration_ms):从默认的 700 调低300200,减少分割静音的等待时间。
  3. 修改后点击确定,并务必勾选主界面的“清理已生成”复选框,然后重新处理视频。

这些调整旨在保留更多可能的语音片段。如果问题依旧,可以尝试暂时取消勾选“启用VAD”,但可能会引入更多背景噪音。

2025-11-13 17:47:52,319 - INFO - 返回缓存的编解码器 Windows-264: libx264
self.proxy_str='http://127.0.0.1:7897'
2025-11-13 17:49:15,178 - INFO - 返回缓存的编解码器 Windows-264: libx264
2025-11-13 17:49:15,178 - INFO - 未找到或未选择硬件编码器,将使用软件编码。
self.proxy_str='http://127.0.0.1:7897'
2025-11-13 17:49:38,630 - INFO - 开始创建 pid:self.pidfile='C:/Users/Liuke/Downloads/win-videotrans-v3.83/tmp15436/15000.lock'
2025-11-13 17:50:33,366 - INFO - Processing audio with duration 15:38.597
2025-11-13 17:50:34,810 - INFO - VAD filter removed 13:12.901 of audio

日志显示 VAD (语音活动检测) 过滤过于激进,移除了大量音频(VAD filter removed 13:12.901 of audio),这会导致最终字幕和配音严重缺失。

请按以下步骤调整 VAD 参数:

  1. 在软件顶部菜单栏,选择 工具/选项 -> 高级选项
  2. 找到 “faster/openai语音识别调整” 区域,进行如下修改:

    • 语音阈值: 从默认的 0.5 调低至 0.30.2,使检测对语音更敏感。
    • 最短语音持续时间/毫秒: 确保此项为 0,避免过短的语音被过滤。
    • 静音分割毫秒: 从默认的 700 调低至 300200,减少分割静音的等待时间。
  3. 修改后点击 确定
  4. 返回主界面,务必勾选“清理已生成”复选框,然后重新处理视频。

如果调整后问题依旧,可以尝试暂时取消勾选“启用VAD”,但可能会引入更多背景噪音。

2025-11-13 17:47:52,319 - INFO - 返回缓存的编解码器 Windows-264: libx264
self.proxy_str='http://127.0.0.1:7897'
2025-11-13 17:49:15,178 - INFO - 返回缓存的编解码器 Windows-264: libx264
2025-11-13 17:49:15,178 - INFO - 未找到或未选择硬件编码器,将使用软件编码。
self.proxy_str='http://127.0.0.1:7897'

日志显示您遇到两个核心问题:

  1. VAD 过滤过于激进VAD filter removed 13:12.901 of audio,这表明语音活动检测误将大量有效语音当作静音移除了,导致最终字幕和配音严重缺失。
  2. 未使用硬件编码未找到或未选择硬件编码器,将使用软件编码,这会导致视频合成阶段速度较慢。

解决方案:

针对 VAD 问题:

  1. 在软件顶部菜单栏,选择 工具/选项 -> 高级选项
  2. 找到 “faster/openai语音识别调整” 区域,进行如下修改:

    • 语音阈值: 从默认的 0.5 调低至 0.30.2,使检测对语音更敏感。
    • 最短语音持续时间/毫秒: 确保此项为 0,避免过短的语音被过滤。
    • 静音分割毫秒: 从默认的 700 调低至 300200,减少分割静音的等待时间。
  3. 修改后点击 确定
  4. 返回主界面,务必勾选“清理已生成”复选框,然后重新处理视频。

针对硬件编码问题:

  1. 高级选项“视频输出控制” 区域,取消勾选“强制软解码”
  2. 如果问题依旧,您的显卡可能不支持 H.264/H.265 硬件编码,或驱动未正确安装。

如果调整 VAD 后问题依旧,可以尝试暂时取消勾选“启用VAD”,但可能会引入更多背景噪音。

怎么判断 软件在使用时是否启用了CUDA

要判断 pyVideoTrans 是否成功启用了 CUDA 加速,请通过以下几种方式综合判断:

1. 观察任务管理器(最直接的方法)

  • 打开 Windows 任务管理器 (Ctrl+Shift+Esc)。
  • 切换到“性能”选项卡。
  • 选择您的 GPU(通常标记为“GPU 0”)。
  • 在软件执行语音识别任务(即“翻译视频和音频”功能的第一步)时,观察“GPU 计算 0”或“3D”的利用率。如果看到明显的利用率飙升(例如从 0% 跃升至 20% 以上),则表明 CUDA 正在工作。其他阶段(如配音、合成)GPU 占用率通常很低或没有。

2. 检查软件日志

  • 处理任务时,软件底部的日志输出区域会显示实时信息。
  • 成功加载 CUDA 时,通常会有类似以下的日志(具体文字可能因版本略有不同):
    Loading model with CUDA...
    Transcribing with CUDA...
    使用设备: cuda
  • 如果看到 使用设备: cpuLoading model with CPU...,则说明未使用 CUDA。

3. 确认软件设置

  • 在主界面的“翻译视频和音频”功能下,开始任务前,必须勾选“CUDA加速”复选框。这是启用 GPU 加速的前提。

4. 验证 CUDA 环境

  • 虽然您已安装 CUDA 13.0,但请确认软件能正确识别。一个快速验证方法是:在软件根目录下,找到 venv 文件夹,在此路径下打开命令提示符 (CMD),依次执行以下命令:

    python -c "import torch; print(torch.cuda.is_available())"
    • 如果输出 True,则 PyTorch 可以识别到 CUDA。
    • 如果输出 False,则说明软件内置的 PyTorch 与您的 CUDA 环境不兼容。

如果以上检查均表明 CUDA 未启用,问题很可能出在软件内置的 PyTorch 版本与您的 CUDA 13.0 不兼容上。

C:\Program Files\NVIDIA\CUDNN\v9.11\bin\12.9如果我是13.0的CUDA需要更改为C:\Program Files\NVIDIA\CUDNN\v9.11\bin\13.0嘛?

是的,您需要将路径中的 12.9 更正为 13.0,以确保 CUDA 和 cuDNN 版本匹配。

具体操作如下:

  1. 检查并修正环境变量:

    • 在 Windows 搜索栏输入“环境变量”并打开“编辑系统环境变量”。
    • 在“系统变量”部分,找到并选中 Path 变量,点击“编辑”。
    • 在列表中找到指向 C:\Program Files\NVIDIA\CUDNN\v9.11\bin\12.9 的条目,将其编辑删除
    • 然后,新建一条,指向您 cuDNN 库中与您 CUDA 13.0 版本对应的正确路径,即 C:\Program Files\NVIDIA\CUDNN\v9.11\bin\13.0
    • 点击“确定”保存所有更改。
  2. 验证更改:

    • 打开一个新的命令提示符 (CMD) 窗口(重要,必须重新打开以使环境变量生效)。
    • 输入 echo %PATH% 并检查输出中是否包含了您刚刚设置的 ...\bin\13.0 路径。

重要说明:

  • cuDNN 的版本号(如 v9.11)是独立的,它需要与您的 CUDA 主版本号(13.0)兼容。您需要确保您下载的 cuDNN v9.11 是明确支持 CUDA 13.x 的版本。
  • 对于 pyVideoTrans 而言,最关键的是其内置的 PyTorch 库能够识别到可用的 CUDA。环境变量修正后,请重新启动软件并再次按照之前的方法(通过任务管理器观察 GPU 占用或检查软件日志)来确认 CUDA 是否已成功启用。
Post Your Reply
Open source and free maintenance is not easy. If this project is helpful to you, please consider making a small donation to help the project continue to maintain and update.

Donate: https://ko-fi.com/jianchang512

Trending Questions