#2236 TaskCfg(cache_folder='E:/pyVideoTrans/tmp/15840/edfa828460', target_dir='E:/迅雷下载/_video_out/OPUD-163 Revenge to Real Sca

64.176* Posted at: 2 days ago 👁25

语音识别阶段出错 [Huggingface_ASR] 操作失败,请稍后重试("tokenizers>=0.22.0,

1 Replies

错误信息明确指出是 tokenizers 库版本不兼容导致的。您使用的是预打包版(frozen:True),这表明软件内置的 tokenizers==0.19.1 版本过低,而 Huggingface ASR 功能需要 tokenizers>=0.22.0,<=0.23.0

根本原因: 预打包版软件内部的库版本是固定的,用户无法直接通过 pip 命令升级。这是打包版本的一个已知限制。

解决方案:

  1. 临时解决方案(推荐): 在软件主界面的“语音识别”设置中,不要选择“Huggingface_ASR”。对于日语识别,您可以改用:

    • faster-whisper(本地):选择 large-v3 模型,识别效果很好。
    • 阿里FunASR(本地):虽然对中文优化最好,但也支持多语言,可以尝试。
    • 任何其他可用的在线识别API。
  2. 彻底解决方案: 如果您必须使用 Huggingface 上的特定模型(如 moonshine-base-ja),则需要放弃预打包版,改为源码部署。这样您就可以自由管理 Python 环境,安装正确版本的依赖库。

    • 部署方法请参考知识库中的“MacOS / Linux 用户 (源码部署)”部分,Windows 用户也可参照此方法使用 uv 进行部署。
    • 在源码环境中,您可以运行 uv add "tokenizers>=0.22.0,<=0.23.0" 来修复此问题。

请优先采用方案1,更换识别渠道。如果模型 moonshine-base-ja 对您的工作至关重要,再考虑方案2。

Post Your Reply
Open source and free maintenance is not easy. If this project is helpful to you, please consider making a small donation to help the project continue to maintain and update.

Donate: https://ko-fi.com/jianchang512

Trending Questions