#2248 进度条一直 卡在这个地方

182.86* Posted at: 2 days ago 👁34

image
一次翻译了十多个文件之后卡住了,忘了具体原因.之后重启电脑每一次翻译都出现这样的情况,不论有没有开cuda加速

7 Replies

根据您描述的情况(批量翻译后卡住,之后每次翻译都卡在“正在识别语音...”阶段),这通常是由 语音识别模型加载失败显存/内存资源未完全释放 导致的。

请按以下步骤排查和解决:

第一步:清理缓存并重启软件

  1. 完全关闭 pyVideoTrans。
  2. 前往您的软件解压目录(例如 D:/videotrans),找到并删除 tmp 文件夹。
  3. 重新启动软件,勾选主界面第一行的“清理已生成”,然后尝试处理一个视频。

第二步:检查并修复模型文件
如果第一步无效,问题很可能出在 faster-whisper 模型文件上。

  1. 前往模型存放目录(通常位于 C:\Users\[您的用户名]\.cache\huggingface\hub\models--Systran--faster-whisper- 下,或您自定义的模型路径)。
  2. 检查您选用的模型(如 large-v3)文件夹是否完整。如果怀疑损坏,可以直接删除整个对应的模型文件夹(例如 large-v3 文件夹)。
  3. 重启软件,软件会自动重新下载模型。

第三步:调整识别参数(针对资源问题)
如果怀疑是显存/内存不足导致加载卡死:

  1. 在软件 菜单 -> 工具 -> 高级选项 中,找到 “Faster/OpenAI/Whisper 语音识别微调” 区域。
  2. 进行以下关键设置以降低资源占用:

    • CUDA数据类型:改为 int8(显存占用最小)。
    • 识别准确度 (beam_size):改为 1
    • 识别准确度 (best_of):改为 1
    • 启用上下文感知:设置为 False
  3. 在主界面,尝试将 识别模式 从“整体识别”切换到 “批量推理”

第四步:查看日志文件
如果以上步骤均无效,请提供完整的错误日志以便精准定位:

  1. 在软件解压目录下,打开 logs 文件夹。
  2. 将其中的最新日志文件(例如 sp_20250415.log)内容复制出来。

请先尝试前三步,尤其是第二步(删除并重下模型),这是解决此类“卡在识别阶段”问题的最常见有效方法。

没有tmp文件夹. 我有两个模型,large-v3V3和medium,两个都不行了.

核心问题很可能是模型文件损坏或缓存冲突。请按以下步骤操作:

  1. 强制清理模型缓存并重新下载

    • 完全关闭 pyVideoTrans。
    • 打开文件资源管理器,在地址栏输入 %USERPROFILE%\.cache\huggingface\hub 并回车。
    • 找到 models--Systran--faster-whisper- 开头的文件夹,将其整个删除
    • 重新启动 pyVideoTrans,它会自动重新下载模型。首次加载会较慢,请耐心等待。
  2. 检查并修改模型下载源(如果上一步下载慢或失败)

    • 在 pyVideoTrans 的 菜单 -> 工具 -> 高级选项 中。
    • 找到 “Faster/OpenAI/Whisper 语音识别微调” 区域。
    • “模型下载地址” 从默认的 https://huggingface.co 改为 https://hf-mirror.com(国内镜像站)。
    • 然后重复第1步,删除缓存文件夹并重启软件。
  3. 以最小资源模式测试

    • 完成模型重下后,在高级选项中确认以下设置以最大程度避免卡死:

      • CUDA数据类型int8
      • beam_size1
      • best_of1
      • 启用上下文感知False
    • 在主界面,不要勾选“CUDA加速”,先使用CPU模式测试。
    • 选择一个短小的视频文件(如1分钟以内)进行测试。

如果完成以上步骤后问题依旧,请提供 logs 文件夹内的最新日志文件内容,以便进一步分析。

为什么不超过70M的同类型为什么在同一个文件夹没有读取出来,200多m的就可以看到并选择

您遇到的是 pyVideoTrans 在读取视频文件时的一个已知限制:它无法识别某些特定编码或封装格式的视频,尤其是某些从网络下载的、编码不标准的 MP4 文件

核心原因分析:

  1. 非标准编码: 虽然都是 MP4 文件,但内部视频流(H.264, H.265/HEVC)和音频流(AAC, MP3)的编码方式、封装参数可能存在差异。pyVideoTrans 依赖 ffprobe(FFmpeg 的一部分)来解析文件信息。如果文件编码特殊或存在错误,ffprobe 可能无法正确识别其媒体流,导致软件认为它不是有效的音视频文件而将其过滤掉。
  2. 文件头信息问题: 某些文件可能缺少必要的元数据或文件头损坏。

解决方案:
最有效的方法是对无法识别的视频进行“重封装”或“转码”。

操作步骤:

  1. 使用 FFmpeg 进行快速重封装(推荐,无损且快速):

    • 下载 FFmpeg 并将其添加到系统环境变量 PATH,或直接使用 pyVideoTrans 自带的 ffmpeg(位于软件根目录的 ffmpeg 文件夹内)。
    • 打开命令提示符(CMD),导航到你的视频文件夹。
    • 执行以下命令(将 input.mp4 替换为你的文件名,output.mp4 替换为新文件名):

      ffmpeg -i "无法识别的视频.mp4" -c copy "可识别的视频.mp4"
    • -c copy 参数表示直接复制流而不重新编码,速度极快且画质无损。生成的新文件几乎肯定能被 pyVideoTrans 识别。
  2. 使用格式工厂等工具转码(备用方案):

    • 如果重封装后仍不行,可能是编码本身不兼容。可以使用“格式工厂”等工具,将视频转换为标准的 H.264 + AAC 编码的 MP4 文件。这是兼容性最广的格式。
  3. 检查 pyVideoTrans 的 ffmpeg 路径:

    • 确保 pyVideoTrans 能正确调用其自带的 ffmpeg。在软件 菜单 -> 工具 -> 设置 中,检查“ffmpeg路径”是否指向了正确的 ffmpeg.exe(通常在软件目录下的 ffmpeg/bin/ffmpeg.exe)。

总结:
70M 的文件无法被识别,而 200M 的可以,这强烈指向了文件编码/封装格式的兼容性问题,而非文件大小本身。请优先尝试 FFmpeg 重封装 方案来解决。

image
进度停在这个地方什么情况

根据截图显示,进度卡在 “正在识别语音...” 阶段,这通常是由 语音识别模型加载失败显存/内存资源耗尽 导致的。请按以下步骤排查:

第一步:强制终止并清理

  1. 完全关闭 pyVideoTrans(包括任务管理器中的残留进程)。
  2. 前往软件解压目录,删除 tmp 文件夹(如果存在)。
  3. 重启软件,务必勾选主界面第一行的 “清理已生成”

第二步:检查并修复模型文件(最可能的原因)

模型文件可能在批量处理时损坏。

  1. 完全关闭软件。
  2. 打开文件资源管理器,在地址栏输入 %USERPROFILE%\.cache\huggingface\hub 并回车。
  3. 找到 models--Systran--faster-whisper- 开头的文件夹,将其整个删除
  4. 重新启动 pyVideoTrans,它会自动重新下载模型。首次加载需要时间,请耐心等待。

第三步:降低资源占用(如果第二步无效)

菜单 -> 工具 -> 高级选项 中,找到 “Faster/OpenAI/Whisper 语音识别微调” 区域,进行以下关键设置:

  • CUDA数据类型:改为 int8(显存占用最小)。
  • 识别准确度 (beam_size):改为 1
  • 识别准确度 (best_of):改为 1
  • 启用上下文感知:设置为 False
    在主界面,尝试将 识别模式 从“整体识别”切换到 “批量推理”

第四步:查看日志定位问题

如果以上步骤均无效,请提供 logs 文件夹 内的最新日志文件内容,以便精准定位错误。

请优先执行第二步(删除模型缓存),这是解决此类“卡在识别阶段”问题的最常见有效方法。

Post Your Reply
Open source and free maintenance is not easy. If this project is helpful to you, please consider making a small donation to help the project continue to maintain and update.

Donate: https://ko-fi.com/jianchang512

Trending Questions