-
#4404 翻译字幕阶段出错 [DeepSeek] 内容太长超出最大允许Token,请减小内容或增大max_token,或者降低每次发送字幕行数...
💬 1[Last reply:2 hours ago] 核心原因:向 DeepSeek 发送的翻译请求(提示词+字幕内容)生成的输出 token 数超过了 DeepSeek API 允许的上限(默认可能为 8192),导致模型输出被截断并报错。解决方案(按顺序尝试):如果 DeepSeek 渠道设置面板中存在 max_token 参数,请打开菜单 → 翻译设置 → Deep...59.41* Posted at: 2 hours ago -
#4403 如果自己上传字幕配音,那么设置更多参数里该如何设置?...
💬 3[Last reply:3 hours ago] 翻译时出现断句错乱、细节遗漏或用词不当,根本原因是翻译模型“智力”不足或上下文理解受限。请按以下方案调整:使用高智能 AI 翻译渠道禁用本地小模型或传统翻译(如 Google、Microsoft)。选择支持超长上下文的大模型: DeepSeek-V3、ChatGPT-4o、Gemini-2.0-Pro 等。在“翻译渠道...91.243* Posted at: 3 hours ago -
#4402 TaskCfg(cache_folder='F:/win-pyvideotrans-v3.91/tmp/6548/58d06ecd9b', target_dir='C:/blender models/Gifdoozer-2/Gifdooze...
💬 1[Last reply:3 hours ago] 错误原因:生成的无声视频文件 novoice.mp4 损坏,缺少必要的 moov atom 数据,导致 ffmpeg 无法读取,后续视频合成中断。这通常是由于输入视频路径中包含特殊字符(如 .、-、空格、括号)或路径过长,在 Windows 命令行处理时出现异常。解决方法(按顺序尝试):重命名并移动原视频:将 4.- ...107.151* Posted at: 3 hours ago -
#4401 在软件翻译视频或音频界面中,上传视频后,在右下角导入原始语言字幕,软件会根据我导入的字幕配音吗?...
💬 3[Last reply:3 hours ago] 配音结果与导入的字幕内容不一致,通常不是因为配音渠道本身会修改文本,而是字幕导入、解析或内部处理环节出现了偏差。在源语言与目标语言相同的情况下,软件会直接使用字幕文本进行配音,不会经过翻译,因此需要按以下步骤排查:检查字幕文件格式:确保是标准 SRT 格式,用记事本打开确认文字内容正确,无乱码、无多余换行或不可见字符。...2408:8214* Posted at: 3 hours ago -
#4400 如何设置语音转字幕,准确率更高...
💬 1[Last reply:3 hours ago] 这是针对无GPU环境下使用本地 Qwen-ASR 模型并配合 LLM 重新断句,提升中文语音转字幕准确率的最佳参数设置。基础设置在“语音识别”行选择 qwen-asr(本地),模型保持1.7B。发音语言务必手动选择“中文”,不要使用auto,避免模型判断错误导致识别率下降。主界面不勾选CUDA加速。核心语音识别参数(菜...2408:8210* Posted at: 3 hours ago -
#4399 [WinError 10061] 由于目标计算机积极拒绝,无法连接。 Traceback (most recent call last): File "httpx\_transports\default.py", line 101, i...
💬 1[Last reply:3 hours ago] 这是由于 OmniVoice-TTS 本地服务没有启动或 API 地址配置错误,导致软件无法连接。错误信息 [WinError 10061] 由于目标计算机积极拒绝,无法连接 表示目标端口没有监听。请按以下步骤排查:确保 OmniVoice-TTS 服务已启动 OmniVoice-TTS 需要独立部署并运行 API ...2408:8214* Posted at: 3 hours ago -
#4398 3.99的更新补丁包地址?...
💬 1[Last reply:4 hours ago] 补丁包与完整安装包在同一地址发布。请前往官方下载页面获取:https://pyvideotrans.com/downpackage...2408:8214* Posted at: 4 hours ago -
#4397 requests.exceptions.ProxyError: HTTPSConnectionPool(host='edge.microsoft.com', port=443): Max retries exceeded with url:...
💬 1[Last reply:4 hours ago] 这是代理配置错误导致无法连接微软翻译服务(edge.microsoft.com)。您在软件主界面的“网络代理地址”文本框中填写了代理地址,但该代理无法连接(目标计算机积极拒绝)。解决方法(二选一):如果您无需使用代理:直接删掉“网络代理地址”文本框里填写的所有内容(留空),然后重试。如果您必须使用代理:确保代理软件(如...125.78* Posted at: 4 hours ago -
#4394 需要翻译的视频是没有声音,但视频中的韩文怎么翻译,单独翻译的话是没有效果...
💬 3[Last reply:6 hours ago] 视频无法读取时长(“截取不到视频时长”)通常是文件路径问题或 FFmpeg 解析失败所致。 最常见的原因是:视频文件路径太长(超过 200 字符)或包含 中文、特殊符号、空格(Windows 下尤其严重);视频文件本身已损坏或不完整;软件缺少 FFmpeg 或 FFmpeg 环境变量未正确配置。解决方案(按顺序尝试)...240e:840* Posted at: 6 hours ago -
#4396 LLM重新断句怎么这么慢了...
💬 3[Last reply:6 hours ago] 提供的日志属于视频合成阶段的调试信息,不包含 LLM 重新断句过程。若需诊断断句速度异常,请取出软件根目录 logs/ 文件夹下涉及 LLM 调用的相关日志(通常会打印类似 LLM rephrase 或调用 AI 接口的超时/完成时间等记录),复制底部约 30 行内容以便分析。...103.172* Posted at: 6 hours ago -
#4395 TaskCfgSTS(is_cuda=False, uuid='3d0e0e2cdd', cache_folder=None, target_dir='J:/YouTube/DIY', source_language=None, sourc...
💬 1[Last reply:6 hours ago] 这是因为发送给AI翻译模型的字幕总长度超过了该模型允许的最大Token数(max_tokens),导致响应被截断。您当前使用的“兼容AI/本地模型”渠道的max_tokens限制为4096,而本次请求的prompt_tokens+completion_tokens已达7122个。解决方案(按推荐顺序):减少每次发送的字...14.153* Posted at: 6 hours ago -
#4393 TaskCfgSTS(is_cuda=False, uuid='39bed11d8d', cache_folder=None, target_dir='...
💬 7[Last reply:6 hours ago] 错误 [WinError 10061] 由于目标计算机积极拒绝,无法连接 表明软件无法与本地大模型 API 服务建立连接,核心原因是服务未运行或地址配置错误。请按以下顺序排查:验证服务是否在运行 在命令行执行 curl http://127.0.0.1:11434/v1/models(请替换为实际端口)。若提示“连接...240e:3ba* Posted at: 6 hours ago -
#4392 在不勾选清理已生成的前题下,已经配过的音频如何在第2次合成时自动调用...
💬 9[Last reply:6 hours ago] 根据日志分析,你在没有关闭软件的情况下,第二次合成时仍然触发了重新配音。这说明即便不关闭软件,配音阶段的临时音频缓存也在第一次翻译任务完成后被自动清除了。这是 pyVideoTrans 的一项设计:为了节省磁盘空间,当一个完整的视频翻译任务(配音→对齐→合成)结束时,软件会立即删除该任务在 tmp 目录下生成的中间配音...103.172* Posted at: 6 hours ago -
#4391 TaskCfgSTS(is_cuda=False, uuid='844b36d1b1', cache_folder=None, target_dir=...
💬 1[Last reply:6 hours ago] 连接错误,是因为软件无法与本地部署的大模型服务建立连接,通常由服务未启动、API 地址错误或端口未开放导致。确认本地大模型服务(如 Ollama、vLLM 等)正在运行,且监听在预期的地址和端口(例如 Ollama 默认 http://localhost:11434)。打开软件菜单 → “翻译设置” → “本地大模型设...14.153* Posted at: 6 hours ago -
#4389 完全相同的参数,每次翻译完的结果会不一样,如何保证稳定...
💬 9[Last reply:6 hours ago] LLM 重新断句的核心任务是优化字幕的语义连贯性和断句结构,并非专门设计用于修正离谱的错误单词。它的处理流程是:读取 SRT 中的原始文本,利用大语言模型对上下文的理解,将零散的短句合并或拆分成长度适宜的完整句子,并同步调整时间轴。在这个过程中,LLM 可能会顺带根据上下文自动修正部分明显的同音错别字或不通顺的表述,但...103.172* Posted at: 7 hours ago -
#4206 克隆音色,怎么不支持上传本地音色,好像没有批量处理,右边字幕只能上传一个视频的吗?想节约时间,提前修改好字幕这样节省时间,但是没有批量处理的...
💬 15[Last reply:7 hours ago] AI感强和断句突兀通常是由语音识别时的字幕切分策略、配音语速/停顿处理不当导致的。可针对性地调整以下参数,让最终音频更加自然流畅。减少句间停顿、使衔接更连贯移除配音前后静音缓冲:进入菜单 → 工具 → 高级选项 → 字幕配音调整,勾选 “移除配音前后静音缓冲”。这会裁剪掉每条配音开头和结尾的静音,使句子衔接更紧凑(但结...74.48* Posted at: 11 days ago -
#4390 TaskCfgSTT(is_cuda=True, uuid='707d968762', cache_folder='E:/PyVideoTrans v3.99(Subtitle generation and translation soft...
💬 1[Last reply:7 hours ago] 这是由 NVIDIA 50 系列显卡(Blackwell 架构)与 CUDA 库不兼容导致的 cuBLAS 调用失败。解决方案:确认已安装 CUDA 12.8 和 cuDNN 9.11(与软件内置版本匹配)。在软件菜单中进入 工具/选项 → 高级选项,将 CUDA数据类型 改为 float16 或 int8。仍然不行时...14.153* Posted at: 7 hours ago -
#4388 采样温度具体说一下作用...
💬 3[Last reply:8 hours ago] 采样温度在 pyVideoTrans 文档中未明确列出默认值,但依据 Whisper 系列模型的标准做法,该值通常默认为 0.0(即完全确定性解码)。在实际使用中,保持软件默认值即可,一般情况下无需调整;若遇到频繁的重复输出,可尝试将此值略微调高(如 0.2~0.5)。...103.172* Posted at: 8 hours ago -
#4387 cli模式怎样批量合并视频和字幕?...
💬 1[Last reply:11 hours ago] CLI模式目前不支持【工具】【视频与字幕合并】的批量操作。其支持的任务类型仅包含语音转录(stt)、文字转语音(tts)、字幕翻译(sts)和视频翻译(vtv),未提供视频与字幕的混流功能。如需批量合并视频和字幕,请使用图形界面的“工具 -> 视频与字幕合并”完成,或自行编写调用 FFmpeg 的批处理脚本。...216.195* Posted at: 11 hours ago -
#4386 TaskCfgSTT(is_cuda=True, uuid='aa9e13113a', cache_folder='E:/haokang/win-pyvideotrans-v3.91_20251220_225815/tmp/10568/aa...
💬 1[Last reply:15 hours ago] 这是由于软件缺少 qwen_asr 模块,通常是因使用了不完整的补丁包或环境损坏导致的。解决方案:重新下载最新完整版:前往 pyvideotrans.com/downpackage 获取 v3.99 完整软件包(.7z 压缩包),不要只下载补丁。正确解压:将完整包解压到非系统盘、无中文和特殊符号的路径(例如 D:\py...34.177* Posted at: 15 hours ago
Open source and free maintenance is not easy. If this project is helpful to you, please consider making a small donation to help the project continue to maintain and update.