#3491 新版本,无法自己提取视频中的音频变成字幕,需要自己喂字幕,但是自己喂字幕又无法批量喂字幕,只能一个视频一个视频的来

240a:42a8* Posted at: 1 hour ago 👁8

新版本,翻译视频的时候无法自己提取视频中的音频变成字幕,自己提取会报错,需要自己喂字幕,但是自己喂字幕又无法批量喂字幕,只能一个视频一个视频的来

1 Replies

根据描述,问题核心在于新版本中视频翻译功能无法自动提取音频生成字幕(报错),而手动导入字幕又无法批量操作。

原因分析:
这很可能与语音识别(ASR)渠道的配置或模型下载失败有关。自动提取音频生成字幕是软件的核心功能,如果此功能失效,通常是由于:

  1. 语音识别渠道(如 faster-whisper)的模型文件下载不完整或缺失。
  2. 网络问题导致无法连接到模型下载源(如 HuggingFace)。
  3. 软件环境(如 CUDA、FFmpeg)配置问题。

解决方案:
请按以下步骤排查和解决:

  1. 检查语音识别渠道与模型

    • 在视频翻译界面,确认“语音识别”渠道已正确选择(例如 faster-whisper(本地))。
    • 检查右侧的模型选择,首次使用需要下载模型。如果下载失败,请参考知识库第11节“手动下载适用于 faster-whisper(本地) 语音识别渠道的模型”,手动下载对应的模型文件(如 large-v3)并放入 软件根目录/models/ 下的对应文件夹中。
  2. 检查网络与代理

    • 如果无法访问 HuggingFace,请在“菜单-设置-网络代理”中配置代理地址,或使用国内镜像源。
  3. 查看具体报错信息

    • 当“自己提取”报错时,请点击错误弹窗的“报告错误”或复制错误信息。
    • 更详细的信息位于软件根目录的 logs 文件夹中,查看以当前日期命名的 .log 文件,复制底部约30行的报错内容,这有助于精确诊断。
  4. 关于批量导入字幕

    • 目前,在“翻译视频或音频”主功能中,手动导入字幕(喂字幕)确实需要逐个视频操作。
    • 替代方案:如果你已有一批视频和对应的字幕文件,可以分两步高效处理:

      • 第一步(批量语音转字幕):使用软件左侧功能面板的 “批量语音转字幕” 功能。将你的视频拖入,选择正确的语音识别渠道和模型,可以批量生成字幕文件(SRT格式)。
      • 第二步(批量视频翻译):回到主翻译界面,拖入视频文件,此时软件会自动关联同目录下同名的SRT字幕文件作为源字幕,无需手动逐个导入。

如果以上步骤无法解决,请提供具体的报错日志以便进一步分析。

请查阅相关文档:

Post Your Reply
Open source and free maintenance is not easy. If this project is helpful to you, please consider making a small donation to help the project continue to maintain and update.

Related resource