#1510 口 启用CUDA?请支装ffmpeg

141.11* Posted at: 1 hour ago 👁10

口 启用CUDA?
请支装ffmpeg

5 Replies

口 启用CUDA?
请支装ffmpeg

根据您的提示,您可能遇到了两个问题:CUDA 加速和 FFmpeg 相关。

关于启用 CUDA:

  1. 如果您有 NVIDIA 显卡并已正确安装 CUDA 驱动,在软件主界面的“翻译视频和音频”功能中,请务必勾选“启用CUDA”复选框,这将极大提升语音识别的速度。
  2. 如果勾选后报错(如显存不足),请尝试在顶部菜单栏选择 工具/选项 -> 高级选项,在“faster/openai语音识别调整”区域,将 CUDA数据类型float32 改为 float16int8,以降低显存消耗。

关于安装 FFmpeg:

  1. Windows 预打包版用户:软件已内置 FFmpeg,通常无需额外安装。如果报错,请检查视频文件路径是否过长或包含特殊字符,并将其移动到纯英文的浅层目录下。
  2. MacOS / Linux 源码部署用户:您需要自行安装 FFmpeg。请通过系统包管理器安装(例如,在 Ubuntu/Debian 上使用 sudo apt install ffmpeg,在 macOS 上使用 brew install ffmpeg),并确保其在系统环境变量中可用。

请根据您的具体情况尝试以上步骤。

您遇到的“启用CUDA?请支装ffmpeg”提示通常意味着以下两种情况:

  1. FFmpeg问题:Windows预打包版已内置FFmpeg,此提示可能是视频文件路径问题。请确保:

    • 视频文件路径为纯英文/数字,不含特殊符号
    • 路径不要太深,建议直接放在D盘或E盘根目录
  2. CUDA问题:如果您有NVIDIA显卡:

    • 在主界面“翻译视频和音频”功能中勾选“启用CUDA”
    • 如果报显存错误,请在“菜单-工具-高级选项”中:

      • 将“CUDA数据类型”改为“float16”或“int8”
      • 降低“字幕识别准确度控制beam_size”和“best_of”的值

如果问题依旧,请提供具体的错误日志(位于软件根目录下videotrans/logs/文件夹内)。

image

您遇到的错误提示表明软件无法连接到 Hugging Face 来下载语音识别模型。这是一个网络连接问题。

解决方法如下:

  1. 使用网络代理(推荐)

    • 如果您有可用的网络代理(科学上网工具),请在软件主界面的 网络代理 输入框中填写您的代理地址和端口(例如 http://127.0.0.1:10809)。
    • 然后重新启动软件并再次尝试。
  2. 手动下载模型(如果无法使用代理)

    • 访问 Hugging Face 模型库(例如 https://huggingface.co/Systran/faster-whisper-large-v3,请根据您选择的模型进行搜索)。
    • 使用浏览器或下载工具(如 git 命令或 huggingface-cli)手动将模型文件下载到本地。
    • 将下载的模型文件夹放置到软件的正确缓存路径下(通常是 C:\Users\[您的用户名]\.cache\huggingface\hub\ 或类似位置)。
  3. 更换语音识别渠道

    • 如果以上方法都不可行,您可以暂时尝试使用其他不需要从 Hugging Face 下载模型的语音识别渠道,例如 阿里FunASR(本地)

请优先尝试设置网络代理,这是最直接有效的解决方案。

Post Your Reply
Open source and free maintenance is not easy. If this project is helpful to you, please consider making a small donation to help the project continue to maintain and update.

Donate: https://ko-fi.com/jianchang512

Trending Questions