-
#4053 TaskCfgVTT(is_cuda=True, uuid='bd101f9a3f', cache_folder='E:/pyvideotrans-v3.98/tmp/9400/bd101f9a3f', target_dir='C:/Use...
💬 1[Last reply:1 hour ago] 该错误是由于内存或显存不足,导致子进程崩溃,无法继续使用进程池。解决方案:检查是否启用了二次识别:如果同时翻译多个视频且启用了“二次识别”,前面视频的二次识别可能会和后面视频的第一次转录同时运行,导致需要2-3倍的显存。请先尝试在主界面右上角取消勾选“二次识别”选项后重试。降低模型大小:将 faster-whisper...103.197* Posted at: 1 hour ago -
#4052 ValueError: The elements of the batch contain different keys. Cannot batch them ({'is_last', 'input_features', 'attentio...
💬 1[Last reply:1 hour ago] 这是由于使用了 HuggingFace ASR 渠道时,模型或数据处理管道内部出现了批次数据键值不一致的错误。解决方案:切换语音识别渠道:暂时避免使用 HuggingFace_ASR 渠道。建议改用 faster-whisper(本地) 或 openai-whisper(本地) 渠道,并选择 large-v3 模型。检...114.32* Posted at: 1 hour ago -
#4050 OmniVoice-TTS配置出错...
💬 3[Last reply:4 hours ago] 该错误通常是由于 OmniVoice-TTS 的 API 服务端点(endpoint)路径与 pyVideoTrans 默认的请求路径不匹配造成的。OmniVoice-TTS 的 WebUI 和 API 服务可能使用了不同的端口或路径。解决方案:确认 API 服务地址:确保您启动的是 OmniVoice-TTS 的 A...182.105* Posted at: 5 hours ago -
#4051 ValueError: Unsupported languages: ['Hindi']. Supported: ['auto', 'chinese', 'english', 'french', 'german', 'italian', '...
💬 1[Last reply:4 hours ago] The error occurs because the Qwen-TTS (local) voice synthesis channel does not support the target language "Hindi" you selected. The channel only supports a lim...103.16* Posted at: 4 hours ago -
#4049 OmniVoice-TTS 配置面板中,找到“instruct”输入框...
💬 1[Last reply:5 hours ago] 在 OmniVoice-TTS 的配置面板中,“instruct”输入框位于“角色”选择框的右侧。具体查找路径如下:点击软件主界面右上角的 菜单 -> 翻译设置。在弹出的设置窗口中,找到并点击 OmniVoice-TTS 标签页。在该标签页中,找到 “角色” 下拉选择框。“instruct”输入框就紧邻在“角色”...182.105* Posted at: 5 hours ago -
#4048 语音识别阶段出错 [Qwen-ASR(本地)] Try: pip install transformers -U or pip install -e '.[dev]' if you're working with git...
💬 1[Last reply:5 hours ago] 这是由于 Qwen-ASR(本地) 渠道依赖的 tokenizers 库版本不兼容导致的。软件内置的 tokenizers 版本为 0.19.1,但 Qwen-ASR 需要版本在 0.22.0 到 0.23.0 之间。解决方案:临时方案(推荐):更换语音识别渠道。对于中文视频,可以尝试使用 faster-whisper...116.28* Posted at: 5 hours ago -
#4047 TaskCfgTTS(is_cuda=False, uuid='2d863cd941', cache_folder='C:/peiyinruanjian/2/win-pyvideotrans-v3.98-0410/tmp/20928/2d8...
💬 1[Last reply:5 hours ago] 这是由于你使用了 ElevenLabs 配音渠道的付费角色,但你的 ElevenLabs 账户是免费订阅,无法通过 API 使用其官方音库中的角色。解决方案:更换配音渠道或角色:在配音渠道中选择其他免费渠道(如 Edge-TTS)或 ElevenLabs 中明确标记为免费的克隆角色。升级 ElevenLabs 订阅:前...148.135* Posted at: 5 hours ago -
#4046 TaskCfg(cache_folder='D:/tts/tmp/7996/20059c023f', target_dir='E:/音频库/4.13/_video_out/1 (1)-mp4', remove_noise=False, is...
💬 1[Last reply:11 hours ago] 这是由于网络代理设置不正确或代理服务不可用导致的。faster-whisper 在尝试从 HuggingFace 下载模型时,因代理问题而失败。解决方案:检查并修正代理设置:在主界面的“网络代理地址”文本框中,确认您填写的代理地址格式正确(例如 http://127.0.0.1:10808)。如果代理服务未运行或端口错...1.161* Posted at: 11 hours ago -
#4045 FileNotFoundError: [Errno 2] No such file or directory: 'ffmpeg'...
💬 1[Last reply:15 hours ago] 这是由于 macOS 系统上缺少 FFmpeg 环境导致的。pyVideoTrans 依赖 FFmpeg 来处理音视频文件,而预打包的 macOS 版本可能不包含 FFmpeg。解决方案:打开终端(Terminal)。使用 Homebrew 安装 FFmpeg:brew install ffmpeg。安装完成后,重启 ...125.46* Posted at: 15 hours ago -
#4044 videotrans.util.help_ffmpeg._FFprobeInternalError: [mov,mp4,m4a,3gp,3g2,mj2 @ 0000017d3c84d380] moov atom not found D:/B...
💬 3[Last reply:15 hours ago] 错误核心原因是软件在音画对齐阶段,尝试读取临时生成的无声视频文件(novoice.mp4)时,发现该文件不完整或已损坏(moov atom not found),导致无法获取视频时长,进程中断。解决方案:强制重新处理:在主界面左上角勾选 清理已生成 复选框,然后重新执行翻译任务。这将清除所有缓存文件,强制软件重新生成所...45.78* Posted at: 15 hours ago -
#1320 ValueError: Requested float16 compute type, but the target device or backend do not support efficient float16 computatio...
💬 11[Last reply:21 hours ago] 问题核心是使用 large-v3 模型进行语音识别时,由于模型过大或系统资源不足,导致子进程异常终止。日志显示 is_cuda=False,说明已关闭CUDA加速,但CPU处理 large-v3 模型仍可能导致内存不足。请按以下步骤解决:更换更小的语音识别模型:在主界面的“语音识别”渠道中,将模型从 large-v3 ...2401:c080* Posted at: 5 months ago -
#4043 卡在 STT use large-v3 starting......
💬 11[Last reply:21 hours ago] 问题核心是 large-v3 模型在 CUDA 环境下初始化失败,导致进程卡死。虽然视频缩短,但模型加载阶段即出现问题。解决方案:验证 CUDA 环境:在 CMD 中运行 nvcc -V 和 nvidia-smi,确认 CUDA 版本为 12.8,且 4080 显卡驱动为最新。强制使用 CPU 模式测试:在主界面取消勾...1.160* Posted at: 22 hours ago -
#4042 双语字幕如何调整字幕样式,比如我希望中文字幕字体大些,英文小些...
💬 5[Last reply:1 day ago] 在 v3.98 版本中,硬字幕样式编辑器确实只有一组样式设置,无法直接为双语字幕的两行分别设置不同样式。这是一个已知的功能限制。要实现中文字体大、英文字体小的效果,目前需要通过间接方法实现:生成双语字幕文件:使用软件正常完成视频翻译,并选择输出“双字幕”(例如“嵌入软字幕(双)”)。翻译完成后,在输出文件夹中找到生成的...2409:8a55* Posted at: 1 day ago -
#4041 requests.exceptions.ConnectionError: HTTPConnectionPool(host='127.0.0.1', port=9988): Max retries exceeded with url: /ap...
💬 1[Last reply:1 day ago] 这是由于你使用了需要本地部署的配音渠道(例如 F5-TTS、CosyVoice、GPT-SoVITS、ChatterBox 等),但对应的本地服务没有启动或端口配置错误。解决方案:确认你使用的配音渠道:查看主界面“配音渠道”下拉列表中的选择。如果是 F5-TTS、CosyVoice、GPT-SoVITS、Chatter...5.34* Posted at: 1 day ago -
#4039 如何添加双语硬字幕,包括样式的调整,如中文字大小,英文字大小等...
💬 15[Last reply:1 day ago] 要使用 ass.json 文件设置双字幕样式,需要分别创建并配置原始语言和目标语言的字幕样式。操作步骤:定位配置文件:软件根目录下应存在 ass.json 文件。如果没有,可以在完成一次视频翻译并嵌入双字幕(硬或软)后,在输出文件夹或临时文件夹中找到生成的 ass.json 文件作为模板。理解结构:一个典型的双字幕 a...2409:8a55* Posted at: 1 day ago -
#4040 openai.InternalServerError: Error code: 503 - {'error': {'code': 'model_not_found', 'message': 'No available channel for...
💬 1[Last reply:1 day ago] 这是由于在 Azure OpenAI 服务中请求了不存在的模型名称 gpt-5.2-pro 导致的。检查并修正模型名称:在软件菜单栏中,点击 翻译设置 -> OpenAI ChatGPT,检查 模型 输入框中的内容。Azure OpenAI 的模型名称通常为 gpt-4o、gpt-4-turbo 或 gpt-35...2408:8207* Posted at: 1 day ago -
#4038 翻译术语表的原理是什么...
💬 1[Last reply:1 day ago] 翻译术语表用于在AI翻译环节,向翻译模型(如ChatGPT、DeepSeek等)提供特定的术语对照关系,强制AI在翻译时优先使用你指定的译法,以确保专业术语、品牌名、人名等翻译的一致性。原理:在调用AI翻译接口时,软件会将你填写的术语表内容(格式为源术语=目标术语)作为提示词的一部分发送给AI模型,引导模型在翻译对应词...2409:8a55* Posted at: 1 day ago -
#4037 requests.exceptions.ProxyError: HTTPSConnectionPool(host='translate.google.com', port=443): Max retries exceeded with ur...
💬 1[Last reply:1 day ago] 这是由于网络代理设置不正确或代理服务未运行导致的。错误信息显示软件尝试通过代理连接 Google 翻译服务,但代理服务器拒绝了连接。解决方案:检查并确保您的代理客户端(如 VPN 或代理软件)正在运行。在主界面的“网络代理地址”文本框中,确认填写的代理地址和端口号正确。格式通常为 http://127.0.0.1:端口...49.77* Posted at: 1 day ago -
#4036 程序内部错误:Parameter randomize_seed is not a valid key-word argument. Please click on 'view API' in the footer of the Gradio...
💬 1[Last reply:1 day ago] 这是由于 F5-TTS API 服务的版本或参数不兼容导致的。解决方案:确保你部署的 F5-TTS 服务是最新版本,并且其 API 接口支持 randomize_seed 参数。如果更新 F5-TTS 服务后问题依旧,请尝试在 pyVideoTrans 的“高级选项”中,将 F5-TTS 的 API 地址从 http:...91.243* Posted at: 1 day ago -
#4035 pyvideotrans...
💬 1[Last reply:1 day ago] 这是由于本地大模型(如 Ollama 中的 Qwen2.5)在翻译阶段主要依赖 CPU 进行推理,而 CUDA 加速仅对语音识别(ASR)阶段有效。解决方案:确认工作阶段:软件工作流程为 语音识别 -> 字幕翻译 -> 语音合成 -> 视频合成。CUDA 加速仅作用于第一步“语音识别”(例如使用 fa...111.18* Posted at: 1 day ago
Open source and free maintenance is not easy. If this project is helpful to you, please consider making a small donation to help the project continue to maintain and update.