-
#4519 Could not parse response content as the length limit was reached - CompletionUsage(completion_tokens=8206, prompt_tokens=3817, total_tokens=12023, completion_tokens_details=Complet...
💬 1[Last reply:1 month ago] 这是由于 AI 翻译返回的内容超出长度限制导致的,常见于选中了“发送完整字幕”而字幕内容过多,或模型本身上下文限制较小。解决方案:取消“发送完整字幕”选项:在主界面的翻译设置中,取消勾选“发送完整字幕”,将字幕按行分批发给 AI。减少每批字幕行数:在“高级选项” → “字幕翻译调整” → “AI翻译渠道每批字幕行数”中,调低数值(如从 20 改为 10 或 5)。升级软件版本:强烈建议升级到最新 ...111.53* Posted at: 1 month ago -
#4518 requests.exceptions.ConnectionError: HTTPConnectionPool(host='127.0.0.1', port=9880): Max retries exceeded with url: /tts (Caused by NewConnectionError('<urllib3.connection.HTTPCon...
💬 1[Last reply:1 month ago] 这是由于本地TTS服务(如GPT-SoVITS、F5-TTS等)未启动或API地址配置不正确,导致软件无法连接到127.0.0.1:9880端口。解决方案:启动TTS服务:确认已正确部署并运行了对应的TTS API服务(如GPT-SoVITS、F5-TTS、CosyVoice等)。该服务需要在终端窗口中保持运行状态。检查API地址:进入软件菜单 → “TTS设置”,找到对应配音渠道,确认API U...240e:360* Posted at: 1 month ago -
#4517 Error while deserializing header: HeaderTooLargeTraceback (most recent call last): File "videotrans\task\_only_one.py",......
💬 1[Last reply:1 month ago] Error while deserializing header: HeaderTooLarge 这个错误通常是由于音频数据过大(比如过长视频或高采样率)导致子进程通信时序列化数据超限,常见于本地 Qwen ASR 模型。解决方案(按推荐顺序尝试):缩短音频输入:在“高级选项”中将“最长语音持续秒数”设为 10,并开启“Whisper预分割音频”(即使使用Qwen ASR,预分割也能避免传递整段大...216.195* Posted at: 1 month ago -
#4516 TaskCfgVTT(is_cuda=True, uuid='bdad21e654', cache_folder='I:/fanyi/win-pyvideotrans-v3.99-0508/tmp/36692/bdad21e654', target_dir='I:/账号运营工作/BaiduSyncdisk/视频待投递/狂野游戏Eslam/_video_out...
💬 1[Last reply:1 month ago] 这是由于输入视频文件路径包含特殊字符(阿拉伯语、表情符号等)且路径过长,导致 ffmpeg 无法正确写入临时音频文件 en.wav。解决方案:将视频文件移动到一个简短、纯英文的目录下,例如 D:\videos\。将文件名重命名为简短英文名称,例如 test.mp4。重新运行软件进行翻译。请查阅相关文档:文件路径过长或含有特殊符号的解决方案...111.53* Posted at: 1 month ago -
#4515 TaskCfgVTT(is_cuda=True, uuid='1a225c475c', cache_folder='D:/fanyi/win-pyvideotrans-v3.99-0508/tmp/8556/1a225c475c', target_dir='D:/shipin/_video_out/LULU-434 -ts', source_language...
💬 3[Last reply:1 month ago] 根据通用经验,DeepSeek V4-flash 的 max_tokens 建议设为 4096 或 8192(该模型通常支持 8192 输出 token)。若仍有“超出限制”报错,说明主要瓶颈在于单次输入内容过多,应优先降低“AI翻译渠道每批字幕行数”(例如设为 5~10 行),而非仅调高 max_tokens。具体操作:在菜单栏 工具/选项 → 高级选项 → 字幕翻译调整 → 将"AI翻译渠道每...125.110* Posted at: 1 month ago -
#4514 Save audio in E:/Application/dupping/win-pyvideotrans-v3.99-417/f5-tts...
💬 3[Last reply:1 month ago] 抱歉之前没有区分清楚。在 pyVideoTrans 中,Index-TTS 与 F5-TTS 共用同一个设置界面(菜单 → TTS 设置 → F5-TTS),参考音频也统一存放在软件目录下的 f5-tts 文件夹里(即 E:/Application/dupping/win-pyvideotrans-v3.99-417/f5-tts/)。所以你尽管使用了 Index-TTS,参考音频的设置位置和方法...2001:ee0* Posted at: 1 month ago -
#4513 RuntimeError: submitting video frame to the encoder encoding a frame: Generic error in an external library...
💬 1[Last reply:1 month ago] 这是由于视频合成时 GPU 硬件编码器出现异常导致的(“Generic error in an external library”),常见于 NVIDIA 显卡驱动或 CUDA 环境不稳定,或视频延长(tpad 滤镜)与硬件编码冲突。解决方案:强制使用软编码: 打开软件菜单 → 工具/选项 → 高级选项 → 视频输出控制,勾选 “强制软编码视频?”。这一步将跳过 GPU 编码,改用 CPU 编码...2409:8a55* Posted at: 1 month ago -
#4511 识别到文字之后卡在resegment:100.21%一直不动...
💬 23[Last reply:1 month ago] 卡在翻译 29 说明 DeepSeek API 对第 29 批请求没有正常返回,可能是遭遇了临时限流(429)、网络闪断或批次内容触发超时。请按以下顺序排查:1. 增大暂停间隔,降低批次大小在菜单 → 工具/选项 → 高级选项 → 字幕翻译调整 中将“AI翻译渠道每批字幕行数”改为 15将“翻译后暂停秒”改为 2保存设置,重新执行任务。这能最大程度避免 API 限流。2. 检查网络代理稳定性如...58.152* Posted at: 1 month ago -
#4512 必须选择视频文件=system:Windows-10-10.0.19041-SP0version:v3.99frozen:Truelanguage:zhroot_dir:E:/新建文件夹...
💬 1[Last reply:1 month ago] 该提示表示尚未选择待处理的视频或音频文件。请点击主界面上的 “选择音频或视频” 按钮,在文件选择窗口中选中文件(可按住 Ctrl 多选)后再点击“开始”按钮。若需批量处理整个文件夹,请先勾选 “文件夹” 选项再选择文件夹。...155.254* Posted at: 1 month ago -
#4510 omnivoice配音中出现其他声音片段...
💬 3[Last reply:1 month ago] 根据日志,“音频溢出截断”是软件在音画对齐阶段,为强制适配字幕时间轴而对配音进行裁剪导致的。这会造成配音突然停止,而“前出现其他声音片段”则可能因截断后的音频残留拼接或VAD分割不精确引起。直接原因:配音音频时长超出字幕时间轴,软件执行了强制截断(音频溢出截断 2034->1990),截断后的音频末尾可能不完整或与相邻片段重叠。解决方案(按推荐顺序尝试):调整对齐策略:在 菜单→工具/选项→...182.84* Posted at: 1 month ago -
#4509 TaskCfgSTT(is_cuda=False, uuid='c8f5627789', cache_folder='F:/win-pyvideotrans-v3.99-0508/tmp/29480/c8f5627789', target_dir='C:/Users/user/Documents/WhisperJAV/output/ja.whisperjav...
💬 1[Last reply:1 month ago] 这是由于 Deepgram API 返回的响应中缺少有效字幕数据,导致解析时索引越界。检查音频文件:确认输入音频/视频文件未被损坏或无声,可尝试用其他播放器播放验证。检查网络与 API Key:确保网络通畅且 Deepgram API Key 有效,避免频繁请求导致限流。降低并发:在 高级选项 → 字幕配音调整 中将 并发配音线程数 设为 1,减少负载。更新到最新版本:v3.99 可能已修复该问题...183.179* Posted at: 1 month ago -
#4507 TaskCfgSTT(is_cuda=True, uuid='57ea865ef8', cache_folder='C:/Users/user/Documents/WhisperJAV/output/ja.whisperjav/win-pyvideotrans-v3.99-0508/tmp/56756/57ea865ef8', target_dir='C:/...
💬 9[Last reply:1 month ago] rephrase 选项位于 菜单 → 工具/选项 → 高级选项 → 语音识别参数 区域,在界面中显示为 "LLM重新断句" 或其下的选项。请按以下步骤操作:1. 点击顶部菜单栏 工具/选项;2. 选择 高级选项 选项卡;3. 在 语音识别参数 部分找到 LLM重新断句 相关设置,将其设为 "不处理" 或 "默认"(对应 rephrase=0)。如果仍然看不到,可以直接关闭 “LLM重新断句” 功能...183.179* Posted at: 1 month ago -
#4508 TaskCfgTTS(is_cuda=True, uuid='48b92f8c80', cache_folder='G:/win-pyvideotrans-v3.98-317/tmp/18996/48b92f8c80', target_dir='G:/win-pyvideotrans-v3.98-317/output/tts', source_languag...
💬 1[Last reply:1 month ago] Edge-TTS 连接超时,原因是软件无法访问微软的语音服务 speech.platform.bing.com,通常是因为在国内没有配置网络代理,或被微软限流。解决方案:配置网络代理:如果你有 VPN 或代理服务,在主界面的“网络代理地址”文本框中填入代理地址(例如 http://127.0.0.1:7890),格式参考你代理客户端的端口。降低并发并增加暂停:在菜单栏 工具/选项 -> 高级...5.83* Posted at: 1 month ago -
#4506 TaskCfgSTT(is_cuda=True, uuid='702e5eac7e', cache_folder='C:/Users/user/Documents/WhisperJAV/output/ja.whisperjav/win-pyvideotrans-v3.99-0508/tmp/56756/702e5eac7e', target_dir='C:/...
💬 1[Last reply:1 month ago] 该错误是由于 Deepgram API 返回的响应格式异常,导致在转换为 SRT 字幕时索引越界。解决方案:检查 Deepgram API 密钥是否有效且配额充足。尝试先用其他渠道(如 faster-whisper)识别同一音频,以确认音频文件本身无问题。如果音频正常,请升级 pyVideoTrans 至最新版(v3.99),或更换其他语音识别渠道。请查阅相关文档:deepgram.com 语音识...183.179* Posted at: 1 month ago -
#4505 TaskCfgSTT(is_cuda=False, uuid='818461c750', cache_folder='C:/Users/user/Documents/WhisperJAV/output/ja.whisperjav/win-pyvideotrans-v3.99-0508/tmp/56756/818461c750', target_dir='C:...
💬 1[Last reply:1 month ago] 这是由于 Deepgram API 返回的响应中缺少有效字幕数据或格式异常,导致解析时索引越界。解决方案:检查网络与 API Key:确保能稳定访问 api.deepgram.com,且 API Key 正确有效。简化音频文件名:当前文件名包含空格、特殊符号和非英文字符(如中文、日文),可能被 Deepgram 或内部解析器视为无效。请将音频文件重命名为纯英文+数字(如 test.wav)再试。验...183.179* Posted at: 1 month ago -
#4504 TaskCfgSTT(is_cuda=False, uuid='3a494f4df7', cache_folder='C:/Users/user/Documents/WhisperJAV/output/ja.whisperjav/win-pyvideotrans-v3.99-0508/tmp/31344/3a494f4df7', target_dir='C:...
💬 1[Last reply:1 month ago] 这是由于 Deepgram 返回的语音识别结果数据类型不匹配(deepgram_captions 库的 bug),导致时间戳比较时出现 int 与 str 类型错误。解决方案:升级软件版本:请下载最新版 pyVideoTrans(v3.99 之后可能有紧急修复补丁),覆盖安装后重试。临时更换语音识别渠道:推荐改用 faster-whisper(本地) 或 openai-whisper(本地),效果...183.179* Posted at: 1 month ago -
#4503 AI翻译附带完整原字幕,开启这个选项能提升多少翻译质量?还有既然发送了完整原字幕,为什么不直接输出完整翻译字幕...
💬 1[Last reply:1 month ago] 开启“AI翻译附带完整原字幕”能显著提升翻译的上下文连贯性和一致性,尤其适用于长对话、多角色或多场景的视频,避免逐句翻译导致语境断裂。具体提升程度取决于模型能力:对支持超长上下文的先进模型(如GPT-4、DeepSeek-V3),翻译结果更自然、术语更统一;对弱模型可能提升有限甚至无效,且token消耗会成倍增加,需注意费用和模型上限。至于“为什么不直接输出完整翻译字幕”:该选项的作用是为AI提供...103.3* Posted at: 1 month ago -
#4502 TaskCfgSTT(is_cuda=False, uuid='2559fa7b93', cache_folder='C:/Users/user/Documents/WhisperJAV/output/ja.whisperjav/win-pyvideotrans-v3.99-0508/tmp/31344/2559fa7b93', target_dir='C:...
💬 1[Last reply:1 month ago] 这是由于音频文件路径或名称包含中文、空格等特殊符号,导致Deepgram API返回数据解析出错。解决方案:将输入音频文件重命名为纯英文且简短的名称(如 test.wav)。把文件移动到路径较浅且无中文、无空格的目录(如 D:\test\)。重新运行任务。如果问题依旧,请检查网络代理设置是否正确,或尝试切换至其他语音识别渠道(如 faster-whisper 本地模型)。...183.179* Posted at: 1 month ago -
#4501 ValueError: Unknown scheme for proxy URL URL('Entry%20not%20found')...
💬 1[Last reply:1 month ago] 这是由于网络代理地址填写错误导致的。Unknown scheme for proxy URL 表示程序无法识别您填入的代理地址格式(例如填入了“Entry not found”这样的无效文本)。解决方案:清空或修正代理地址:在主界面的“网络代理地址”输入框中,确保填写的是正确的代理服务器地址,格式如 http://127.0.0.1:10809(端口号根据实际代理客户端填写)。如果不使用代理:请将...183.179* Posted at: 1 month ago -
#4500 默认设置下,是否会使用vad作为whisper或faster whisper识别的前置处理过程?还是说必须开启 Whisper预分割音频 选项,才会使用silero?...
💬 3[Last reply:1 month ago] 开启说话人识别(pyannote)不会影响断句结果。断句由 VAD 和 Whisper 模型的语音活动检测参数控制,说话人分离仅在识别完成后为每条字幕附加说话人标签,不改变字幕的时间轴和文本分割。...103.3* Posted at: 1 month ago
Open source and free maintenance is not easy. If this project is helpful to you, please consider making a small donation to help the project continue to maintain and update.
Dondate: ko-fi.com/jianchang512