#1446 软件只支持CUDA 12.8？已经安装了13.0 使用时GPU没有占用

109.122* Posted at: 1 month ago 👁190

软件只支持CUDA 12.8？已经安装了13.0 使用时GPU没有占用

11 Replies

Floor #1 DeepSeek Posted at 1 month ago

根据官方信息，pyVideoTrans 使用的 faster-whisper 库通常对 CUDA 版本有较好的向下兼容性。您已安装 CUDA 13.0，理论上应能正常工作。

GPU 未被占用的可能原因及解决方案如下：

未正确勾选 CUDA 加速选项：
- 在软件主界面的“翻译视频和音频”功能下，开始执行任务前，请务必勾选 “CUDA加速” 复选框。
CUDA 环境未正确配置：
- 请确认您安装的是 NVIDIA 显卡驱动 和 CUDA Toolkit，而不仅仅是 Visual Studio 中的编译工具。
- 打开命令提示符 (CMD)，输入 nvcc --version 检查 CUDA 版本是否能被系统识别。如果无法识别，可能需要将 CUDA 的安装路径（如 C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v13.0\bin）添加到系统的 PATH 环境变量中。
PyTorch 与 CUDA 版本不匹配：
- 软件内置的 PyTorch 可能并非针对 CUDA 13.0 编译。一个常见的解决方法是，在软件根目录下，找到并进入 venv 文件夹，然后在此路径下打开 CMD，执行以下命令来安装与您 CUDA 13.0 兼容的 PyTorch：
```
pip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu121
```
- 注意：上述命令安装的是 CUDA 12.1 版本的 PyTorch，但 CUDA 12.1 与 13.0 通常是兼容的。如果此方法无效，可能需要寻找特定于 CUDA 13.0 的 wheel 包。
显卡硬件限制：
- 请确认您的 NVIDIA 显卡支持 CUDA。较老的显卡可能无法运行。

如果以上步骤仍无法解决问题，请提供软件运行时 videotrans/logs/ 目录下的错误日志文件，以便进行更精确的分析。

Floor #2 109.122* Posted at 1 month ago

Application started at 2025-11-13 17:47:52

2025-11-13 17:47:52,319 - INFO - 返回缓存的编解码器 Windows-264: libx264
self.proxy_str='http://127.0.0.1:7897'
2025-11-13 17:49:15,178 - INFO - 返回缓存的编解码器 Windows-264: libx264
2025-11-13 17:49:15,178 - INFO - 未找到或未选择硬件编码器，将使用软件编码。
self.proxy_str='http://127.0.0.1:7897'
2025-11-13 17:49:38,630 - INFO - 开始创建 pid:self.pidfile='C:/Users/Liuke/Downloads/win-videotrans-v3.83/tmp15436/15000.lock'
2025-11-13 17:50:33,366 - INFO - Processing audio with duration 15:38.597
2025-11-13 17:50:34,810 - INFO - VAD filter removed 13:12.901 of audio
2025-11-13 17:50:34,810 - DEBUG - VAD filter kept the following audio segments: [00:04.128 -> 00:04.256], [00:04.608 -> 00:05.536], [00:05.888 -> 00:06.272], [00:07.072 -> 00:08.320], [00:08.736 -> 00:12.800], [00:13.504 -> 00:14.624], [00:15.200 -> 00:16.640], [00:17.408 -> 00:18.144],

Floor #3 DeepSeek Posted at 1 month ago

从您提供的日志片段来看，问题核心在于 语音识别阶段的 VAD (语音活动检测) 过滤过于激进，导致大量有效语音被误判为静音而移除（VAD filter removed 13:12.901 of audio），这直接造成最终字幕和配音大量缺失。

解决方案：调整 VAD 参数

在软件顶部菜单栏，选择 工具/选项 -> 高级选项。
找到 “faster/openai语音识别调整” 区域，进行如下修改：
- 语音阈值 (speech_threshold)：从默认的 0.5 调低至 0.3 或 0.2。这会使检测对语音更敏感。
- 最短语音持续时间/毫秒 (min_speech_duration_ms)：确保此项为 0，避免过短的语音被过滤。
- 静音分割毫秒 (min_silence_duration_ms)：从默认的 700 调低至 300 或 200，减少分割静音的等待时间。
修改后点击确定，并务必勾选主界面的“清理已生成”复选框，然后重新处理视频。

这些调整旨在保留更多可能的语音片段。如果问题依旧，可以尝试暂时取消勾选“启用VAD”，但可能会引入更多背景噪音。

Floor #4 109.122* Posted at 1 month ago

Floor #5 DeepSeek Posted at 1 month ago

日志显示 VAD (语音活动检测) 过滤过于激进，移除了大量音频（VAD filter removed 13:12.901 of audio），这会导致最终字幕和配音严重缺失。

请按以下步骤调整 VAD 参数：

在软件顶部菜单栏，选择 工具/选项 -> 高级选项。
找到 “faster/openai语音识别调整” 区域，进行如下修改：
- 语音阈值: 从默认的 0.5 调低至 0.3 或 0.2，使检测对语音更敏感。
- 最短语音持续时间/毫秒: 确保此项为 0，避免过短的语音被过滤。
- 静音分割毫秒: 从默认的 700 调低至 300 或 200，减少分割静音的等待时间。
修改后点击确定。
返回主界面，务必勾选“清理已生成”复选框，然后重新处理视频。

如果调整后问题依旧，可以尝试暂时取消勾选“启用VAD”，但可能会引入更多背景噪音。

Floor #6 109.122* Posted at 1 month ago

Floor #7 DeepSeek Posted at 1 month ago

日志显示您遇到两个核心问题：

VAD 过滤过于激进：VAD filter removed 13:12.901 of audio，这表明语音活动检测误将大量有效语音当作静音移除了，导致最终字幕和配音严重缺失。
未使用硬件编码：未找到或未选择硬件编码器，将使用软件编码，这会导致视频合成阶段速度较慢。

解决方案：

针对 VAD 问题：

在软件顶部菜单栏，选择 工具/选项 -> 高级选项。
找到 “faster/openai语音识别调整” 区域，进行如下修改：
- 语音阈值: 从默认的 0.5 调低至 0.3 或 0.2，使检测对语音更敏感。
- 最短语音持续时间/毫秒: 确保此项为 0，避免过短的语音被过滤。
- 静音分割毫秒: 从默认的 700 调低至 300 或 200，减少分割静音的等待时间。
修改后点击确定。
返回主界面，务必勾选“清理已生成”复选框，然后重新处理视频。

针对硬件编码问题：

在 高级选项 的 “视频输出控制” 区域，取消勾选“强制软解码”。
如果问题依旧，您的显卡可能不支持 H.264/H.265 硬件编码，或驱动未正确安装。

如果调整 VAD 后问题依旧，可以尝试暂时取消勾选“启用VAD”，但可能会引入更多背景噪音。

Floor #8 109.122* Posted at 1 month ago

怎么判断软件在使用时是否启用了CUDA

Floor #9 DeepSeek Posted at 1 month ago

要判断 pyVideoTrans 是否成功启用了 CUDA 加速，请通过以下几种方式综合判断：

1. 观察任务管理器（最直接的方法）

打开 Windows 任务管理器 (Ctrl+Shift+Esc)。
切换到“性能”选项卡。
选择您的 GPU（通常标记为“GPU 0”）。
在软件执行语音识别任务（即“翻译视频和音频”功能的第一步）时，观察“GPU 计算 0”或“3D”的利用率。如果看到明显的利用率飙升（例如从 0% 跃升至 20% 以上），则表明 CUDA 正在工作。其他阶段（如配音、合成）GPU 占用率通常很低或没有。

2. 检查软件日志

处理任务时，软件底部的日志输出区域会显示实时信息。
成功加载 CUDA 时，通常会有类似以下的日志（具体文字可能因版本略有不同）：
Loading model with CUDA...
Transcribing with CUDA...
使用设备: cuda
如果看到 使用设备: cpu 或 Loading model with CPU...，则说明未使用 CUDA。

3. 确认软件设置

在主界面的“翻译视频和音频”功能下，开始任务前，必须勾选“CUDA加速”复选框。这是启用 GPU 加速的前提。

4. 验证 CUDA 环境

虽然您已安装 CUDA 13.0，但请确认软件能正确识别。一个快速验证方法是：在软件根目录下，找到 venv 文件夹，在此路径下打开命令提示符 (CMD)，依次执行以下命令：
```
python -c "import torch; print(torch.cuda.is_available())"
```
- 如果输出 True，则 PyTorch 可以识别到 CUDA。
- 如果输出 False，则说明软件内置的 PyTorch 与您的 CUDA 环境不兼容。

如果以上检查均表明 CUDA 未启用，问题很可能出在软件内置的 PyTorch 版本与您的 CUDA 13.0 不兼容上。

Floor #10 109.122* Posted at 1 month ago

C:\Program Files\NVIDIA\CUDNN\v9.11\bin\12.9如果我是13.0的CUDA需要更改为C:\Program Files\NVIDIA\CUDNN\v9.11\bin\13.0嘛？

Floor #11 DeepSeek Posted at 1 month ago

是的，您需要将路径中的 12.9 更正为 13.0，以确保 CUDA 和 cuDNN 版本匹配。

具体操作如下：

检查并修正环境变量：
- 在 Windows 搜索栏输入“环境变量”并打开“编辑系统环境变量”。
- 在“系统变量”部分，找到并选中 Path 变量，点击“编辑”。
- 在列表中找到指向 C:\Program Files\NVIDIA\CUDNN\v9.11\bin\12.9 的条目，将其编辑或删除。
- 然后，新建一条，指向您 cuDNN 库中与您 CUDA 13.0 版本对应的正确路径，即 C:\Program Files\NVIDIA\CUDNN\v9.11\bin\13.0。
- 点击“确定”保存所有更改。
验证更改：
- 打开一个新的命令提示符 (CMD) 窗口（重要，必须重新打开以使环境变量生效）。
- 输入 echo %PATH% 并检查输出中是否包含了您刚刚设置的 ...\bin\13.0 路径。

重要说明：

cuDNN 的版本号（如 v9.11）是独立的，它需要与您的 CUDA 主版本号（13.0）兼容。您需要确保您下载的 cuDNN v9.11 是明确支持 CUDA 13.x 的版本。
对于 pyVideoTrans 而言，最关键的是其内置的 PyTorch 库能够识别到可用的 CUDA。环境变量修正后，请重新启动软件并再次按照之前的方法（通过任务管理器观察 GPU 占用或检查软件日志）来确认 CUDA 是否已成功启用。