pyVideoTrans 对电脑配置有要求,具体要求取决于您使用的功能模式。
核心配置要求:
- 操作系统:支持 Windows 10/11、macOS、Linux。不支持 Windows 7。
CPU 与内存:
- 基础使用:无特殊要求,但性能越好处理速度越快。
- 本地语音识别/配音:强烈建议内存 ≥ 16GB。使用大型本地模型(如
large-v3)处理长视频时,内存不足可能导致崩溃。
GPU(显卡):
- 非必需但强烈推荐:如果使用本地语音识别(如 faster-whisper)或本地 TTS 模型,NVIDIA 显卡能通过 CUDA 实现数十倍的加速。
- CUDA 要求:软件内置支持 CUDA 12.8。需搭配相应版本的 NVIDIA 显卡驱动和 cuDNN。
- 显存要求:使用
large-v3 模型建议显存 ≥ 10GB。若显存不足,需改用更小的模型(如 medium、small)或在“高级选项”中调整量化参数(如使用 float16 或 int8)。
- 硬盘空间:确保有足够的临时空间。处理视频(尤其是开启“视频慢速”功能时)会产生大量缓存文件,可能远超原视频大小。建议预留至少原视频体积 5-10 倍的可用空间。
- 网络:部分在线识别、翻译、配音渠道(如 OpenAI、Google、Gemini)需要访问境外服务器,在中国大陆地区使用时需自行配置网络代理。
最佳实践建议:
- 语音识别(ASR):中文视频推荐使用
Qwen-ASR(本地);非中文推荐 faster-whisper(本地) large-v3 模型(需 CUDA 加速)。 - 翻译:追求质量首选在线 AI 大模型渠道,如 DeepSeek、ChatGPT、Gemini。
- 配音(TTS):免费首选
Edge-TTS;高质量中文克隆可选 Qwen-TTS(本地)、F5-TTS、CosyVoice。
如果遇到显存或内存不足的错误,请参考知识库中的解决方案,例如更换更小的模型、调整高级选项中的 CUDA数据类型、beam_size 等参数。
请查阅相关文档: