#4610 通过python调用cli.py,多次频繁报出缺少各种依赖,没有找到requirements文件,如何一次性解决。

13.250* Posted at: 1 day ago 👁31

通过python调用cli.py,多次频繁报出缺少各种依赖,没有找到requirements文件,如何一次性解决。

9 Replies

这是由于项目使用 uv 包管理器而非传统的 requirements.txt 来管理依赖。需要安装 uv 后运行 uv sync 一次性安装所有依赖。

解决方案:

  1. 安装 uv(参考:https://pyvideotrans.com/blog/windows-uv-install-uv)。
  2. 在项目根目录(即包含 pyproject.tomluv.lock 的目录)下执行 uv sync,该命令会自动解析并安装所有依赖。

如果使用 Windows 且不想处理环境配置,建议直接下载预打包版(.exe)运行,解压后双击 sp.exe 即可,无需源码部署。

请查阅相关文档:

如何下载全部文档?我需要投喂给大模型使用。尤其是cli部分

暂无法直接下载全部文档。当前官方文档以网页形式发布,无打包下载入口。若需投喂给大模型,建议手动复制关键页面内容(如 pyvideotrans.com/cli 等)合并为文本文件。CLI 部分可参考:
《命令行模式使用 pyVideoTrans》(https://pyvideotrans.com/cli)
其中包含所有任务类型(stt/tts/sts/vtv)的参数说明与示例。

本地语音转文字,阿里百炼 Qwen3-ASR对应6,这个模型是使用api还是本地模型,如何使用本地的1.7B模型进行识别。我已经在D:\pyVideoTrans\models\models--Qwen--Qwen3-ASR-1.7B中放入了模型。

你已正确放置模型到 D:\pyVideoTrans\models\models--Qwen--Qwen3-ASR-1.7B,接下来在软件主界面的语音识别渠道下拉列表中选择 qwen-asr(本地),模型会自动加载本地文件,无需额外配置。如果仍报错,请检查:文件夹命名是否完全一致(包括中间的双短横 --);模型文件是否完整(应包含 model-00001-of-00002.safetensors 等分片文件及 tokenizer.json 等)。若仍有问题,请提供日志文件底部 30 行报错信息。

我是用的是cli模式,现在报错[WARNING] cut_audio 时长小于 2000ms 需要下个字幕左移开始时间,diff=720,prev_diff=0,next_diff=0
STT ended:59s
Traceback (most recent call last):
File "D:\pyVideoTrans\cli.py", line 490, in

main()

File "D:\pyVideoTrans\cli.py", line 397, in main

stt_fun({**common_params, **stt_params})

File "D:\pyVideoTrans\cli.py", line 245, in stt_fun

trk.recogn()

File "D:\pyVideoTrans\videotrans\task\_speech2text.py", line 191, in recogn

raw_subtitles = run(

File "D:\pyVideoTrans\videotrans\recognition\__init__.py", line 268, in run

return GeminiRecogn(**kwargs).run()

File "D:\pyVideoTrans\videotrans\recognition\_base.py", line 143, in run

res = self._exec()

File "D:\pyVideoTrans\videotrans\recognition\_gemini.py", line 149, in _exec

raise RuntimeError('No result:The return format may not meet the requirements')

RuntimeError: No result:The return format may not meet the requirements
❌ [STT] 提取失败,错误代码: Command '['D:/pyVideoTrans/.venv/Scripts/python.exe', 'D:/pyVideoTrans\cli.py', '--task', 'stt', '--name', 'D:\pycharm项目文件夹\视频洗稿并输出视频\workspace\test_video.mp4', '--recogn_type', '6', '--model_name', 'Qwen3-ASR-1.7B', '--cuda']' returned non-zero exit status 1.
❌ test_video.mp4 处理失败!

🎉 批量任务结束!共成功生成 0 份字幕。

进程已结束,退出代码0

根本原因:--recogn_type 6 在软件中对应的是 Gemini AI 语音识别,而非 Qwen3-ASR 本地模型。错误日志显示调用了 GeminiRecogn 并因返回格式不符而失败。
解决方案:

  1. --recogn_type 6 改为 --recogn_type 7(如果本地 qwen-asr 的枚举值是 7,请确认实际值;也可直接查看 videotrans/recognition/__init__.py 中的映射关系)。
  2. 输入文件路径包含中文和空格(D:\pycharm项目文件夹\...),可能导致 CLI 解析异常,建议将视频文件移至纯英文路径(如 D:\videos\test_video.mp4)。
  3. 确保 --cuda 参数仅在已安装 CUDA 环境时使用,否则可能导致无法加载模型。

若仍报错,请提供 logs/ 目录下的完整日志。

我通过cli调用kokoro,并且已经在sp.exe中调用了kokoro,现在大模型的位置在D:\pyVideoTrans\models\kokoro-uiapi-v0.2,应该如何调用。

首先确认已在 GUI (sp.exe) 中成功调用 Kokoro 一次,这会在软件配置中写入相应设置。
然后在 CLI 中调用时需指定正确的 --tts_type 编号(该编号可在 GUI 中查看 Kokoro 在下拉列表中的顺序,或直接查看软件配置目录下的 set.ini 文件找到 tts_type 值)。
确保 Kokoro 的 API 服务保持运行(即部署的 API 终端窗口不能关闭)。

示例命令(假设 --tts_type7,角色名为 kokoro,实际数值请以你的配置为准):

uv run cli.py --task tts --name "D:\input.srt" --tts_type 7 --voice_role "kokoro" --cuda

如果仍报错,请提供 logs/ 下的完整日志(或复现后发错误栈底部 30 行)。

请查阅相关文档:

Post Your Reply
Open source and free maintenance is not easy. If this project is helpful to you, please consider making a small donation to help the project continue to maintain and update.

Related resource