#4610 通过python调用cli.py，多次频繁报出缺少各种依赖，没有找到requirements文件，如何一次性解决。

13.250* Posted at: 2 months ago

通过python调用cli.py，多次频繁报出缺少各种依赖，没有找到requirements文件，如何一次性解决。

Floor #1 DeepSeek reply at 2 months ago

这是由于项目使用 uv 包管理器而非传统的 requirements.txt 来管理依赖。需要安装 uv 后运行 uv sync 一次性安装所有依赖。

解决方案：

安装 uv（参考：https://pyvideotrans.com/blog/windows-uv-install-uv）。
在项目根目录（即包含 pyproject.toml 和 uv.lock 的目录）下执行 uv sync，该命令会自动解析并安装所有依赖。

如果使用 Windows 且不想处理环境配置，建议直接下载预打包版（.exe）运行，解压后双击 sp.exe 即可，无需源码部署。

请查阅相关文档：

Floor #2 2406:da18* reply at 2 months ago

如何下载全部文档？我需要投喂给大模型使用。尤其是cli部分

Floor #3 DeepSeek reply at 2 months ago

暂无法直接下载全部文档。当前官方文档以网页形式发布，无打包下载入口。若需投喂给大模型，建议手动复制关键页面内容（如 pyvideotrans.com/cli 等）合并为文本文件。CLI 部分可参考：
《命令行模式使用 pyVideoTrans》(https://pyvideotrans.com/cli)
其中包含所有任务类型（stt/tts/sts/vtv）的参数说明与示例。

Floor #4 52.220* reply at 2 months ago

本地语音转文字，阿里百炼 Qwen3-ASR对应6，这个模型是使用api还是本地模型，如何使用本地的1.7B模型进行识别。我已经在D:\pyVideoTrans\models\models--Qwen--Qwen3-ASR-1.7B中放入了模型。

Floor #5 DeepSeek reply at 2 months ago

你已正确放置模型到 D:\pyVideoTrans\models\models--Qwen--Qwen3-ASR-1.7B，接下来在软件主界面的语音识别渠道下拉列表中选择 qwen-asr(本地)，模型会自动加载本地文件，无需额外配置。如果仍报错，请检查：文件夹命名是否完全一致（包括中间的双短横 --）；模型文件是否完整（应包含 model-00001-of-00002.safetensors 等分片文件及 tokenizer.json 等）。若仍有问题，请提供日志文件底部 30 行报错信息。

Floor #6 52.220* reply at 2 months ago

我是用的是cli模式，现在报错[WARNING] cut_audio 时长小于 2000ms 需要下个字幕左移开始时间,diff=720,prev_diff=0,next_diff=0
STT ended:59s
Traceback (most recent call last):
File "D:\pyVideoTrans\cli.py", line 490, in

main()

File "D:\pyVideoTrans\cli.py", line 397, in main

stt_fun({**common_params, **stt_params})

File "D:\pyVideoTrans\cli.py", line 245, in stt_fun

trk.recogn()

File "D:\pyVideoTrans\videotrans\task\_speech2text.py", line 191, in recogn

raw_subtitles = run(

File "D:\pyVideoTrans\videotrans\recognition\__init__.py", line 268, in run

return GeminiRecogn(**kwargs).run()

File "D:\pyVideoTrans\videotrans\recognition\_base.py", line 143, in run

res = self._exec()

File "D:\pyVideoTrans\videotrans\recognition\_gemini.py", line 149, in _exec

raise RuntimeError('No result:The return format may not meet the requirements')

RuntimeError: No result:The return format may not meet the requirements
❌ [STT] 提取失败，错误代码: Command '['D:/pyVideoTrans/.venv/Scripts/python.exe', 'D:/pyVideoTrans\cli.py', '--task', 'stt', '--name', 'D:\pycharm项目文件夹\视频洗稿并输出视频\workspace\test_video.mp4', '--recogn_type', '6', '--model_name', 'Qwen3-ASR-1.7B', '--cuda']' returned non-zero exit status 1.
❌ test_video.mp4 处理失败！

🎉 批量任务结束！共成功生成 0 份字幕。

进程已结束,退出代码0

Floor #7 DeepSeek reply at 2 months ago

根本原因：--recogn_type 6 在软件中对应的是 Gemini AI 语音识别，而非 Qwen3-ASR 本地模型。错误日志显示调用了 GeminiRecogn 并因返回格式不符而失败。
解决方案：

将 --recogn_type 6 改为 --recogn_type 7（如果本地 qwen-asr 的枚举值是 7，请确认实际值；也可直接查看 videotrans/recognition/__init__.py 中的映射关系）。
输入文件路径包含中文和空格（D:\pycharm项目文件夹\...），可能导致 CLI 解析异常，建议将视频文件移至纯英文路径（如 D:\videos\test_video.mp4）。
确保 --cuda 参数仅在已安装 CUDA 环境时使用，否则可能导致无法加载模型。

若仍报错，请提供 logs/ 目录下的完整日志。

Floor #8 2406:da18* reply at 2 months ago

我通过cli调用kokoro，并且已经在sp.exe中调用了kokoro，现在大模型的位置在D:\pyVideoTrans\models\kokoro-uiapi-v0.2，应该如何调用。

Floor #9 DeepSeek reply at 2 months ago

首先确认已在 GUI (sp.exe) 中成功调用 Kokoro 一次，这会在软件配置中写入相应设置。
然后在 CLI 中调用时需指定正确的 --tts_type 编号（该编号可在 GUI 中查看 Kokoro 在下拉列表中的顺序，或直接查看软件配置目录下的 set.ini 文件找到 tts_type 值）。
确保 Kokoro 的 API 服务保持运行（即部署的 API 终端窗口不能关闭）。

示例命令（假设 --tts_type 为 7，角色名为 kokoro，实际数值请以你的配置为准）：

uv run cli.py --task tts --name "D:\input.srt" --tts_type 7 --voice_role "kokoro" --cuda

如果仍报错，请提供 logs/ 下的完整日志（或复现后发错误栈底部 30 行）。

#4610 通过python调用cli.py，多次频繁报出缺少各种依赖，没有找到requirements文件，如何一次性解决。

9 Replies

请查阅相关文档：

请查阅相关文档：

Post Your Reply

Related resource