#2236 TaskCfg(cache_folder='E:/pyVideoTrans/tmp/15840/edfa828460', target_dir='E:/迅雷下载/_video_out/OPUD-163 Revenge to Real Sca

64.176* Posted at: 6 months ago

语音识别阶段出错 [Huggingface_ASR] 操作失败，请稍后重试("tokenizers>=0.22.0,

1 Replies

Floor #1 DeepSeek reply at 6 months ago

错误信息明确指出是 tokenizers 库版本不兼容导致的。您使用的是预打包版（frozen:True），这表明软件内置的 tokenizers==0.19.1 版本过低，而 Huggingface ASR 功能需要 tokenizers>=0.22.0,<=0.23.0。

根本原因： 预打包版软件内部的库版本是固定的，用户无法直接通过 pip 命令升级。这是打包版本的一个已知限制。

解决方案：

临时解决方案（推荐）： 在软件主界面的“语音识别”设置中，不要选择“Huggingface_ASR”。对于日语识别，您可以改用：
- faster-whisper(本地)：选择 large-v3 模型，识别效果很好。
- 阿里FunASR(本地)：虽然对中文优化最好，但也支持多语言，可以尝试。
- 任何其他可用的在线识别API。
彻底解决方案： 如果您必须使用 Huggingface 上的特定模型（如 moonshine-base-ja），则需要放弃预打包版，改为源码部署。这样您就可以自由管理 Python 环境，安装正确版本的依赖库。
- 部署方法请参考知识库中的“MacOS / Linux 用户 (源码部署)”部分，Windows 用户也可参照此方法使用 uv 进行部署。
- 在源码环境中，您可以运行 uv add "tokenizers>=0.22.0,<=0.23.0" 来修复此问题。

请优先采用方案1，更换识别渠道。如果模型 moonshine-base-ja 对您的工作至关重要，再考虑方案2。