Page 67 BBS.pyVideoTrans.com Response(id='resp_021778000716326e3c0010419774ef230e4bef6206f9366b2802d', created_at=1778000718.0, error=None, incomplet...

#4434 Response(id='resp_021778000716326e3c0010419774ef230e4bef6206f9366b2802d', created_at=1778000718.0, error=None, incomplet......

[Last reply:2 months ago] 不对。这完全是豆包模型的胡言乱语。AI 模型有时会因为解码错误而产生这种无意义的循环重复内容，请直接忽略。...

103.3* Posted at: 2 months ago

#4433 TaskCfgVTT(is_cuda=True, uuid='5c79baddaa', cache_folder='E:/3.98/tmp/3020/5c79baddaa', target_dir='D:/Course/The High-Density Coloring Guide to Bring Your Ideas to Life/SECTION 06...

[Last reply:2 months ago] This error indicates a memory allocation failure during the faster-whisper speech recognition step — either your system RAM or GPU VRAM is insufficient for the current model and settings.How to fix (t...

2405:4802* Posted at: 2 months ago

#4432 KeyError: 'code'...

💬 1

[Last reply:2 months ago] The translation failed because your custom translation API endpoint did not return the expected JSON field code. In TransAPI mode, pyVideoTrans requires the response to contain "code": 0 to ...

2405:4802* Posted at: 2 months ago

#4430 为什么设置了最长语音持续秒数为4或5这样的值，最后输出的字幕还是会有8秒9秒的超长字幕...

💬 9

[Last reply:2 months ago] LLM 重新断句产生时间轴偏移，是因为模型重新生成了字幕的起止时间，而原始时间轴信息在断句时被修改或丢弃。这是其工作原理决定的，尤其在通过 LLM 重新切分合并句子时，若提示词未严格约束时间轴保持原样，极易出现偏差，即使使用最先进的模型也难完全避免。若你必须获得时间轴精准且长度合适的字幕，请按以下优先顺序尝试：方案一：放弃 LLM 重新断句，完全依靠 VAD + Whisper 预分割硬性控制时长...

103.3* Posted at: 2 months ago

#4431 Auth Deppl secret required...

💬 1

[Last reply:2 months ago] This error occurs because you selected DeepL as the translation channel but did not provide an API key (Auth Key). DeepL requires authentication to use its translation service.How to fix:Obtain a Deep...

2405:4802* Posted at: 2 months ago

#4428 合并于输出这一步卡了30分钟还没完成...

💬 5

[Last reply:2 months ago] 视频输出选项的默认设置如下（可在菜单栏“工具/选项-高级选项-视频输出控制”中查看和修改）：视频输出质量控制：23（范围 0-51，值越小质量越高但视频越大，值越大质量越低文件越小）输出视频压缩率：fast（可选项 ultrafast / superfast / veryfast / faster / fast / medium / slow / slower / veryslow，速度越快画质越...

94.177* Posted at: 2 months ago

#4429 aiohttp.client_exceptions.ConnectionTimeoutError: Connection timeout to host wss://speech.platform.bing.com/consumer/speech/synthesize/readaloud/edge/v1?TrustedClientToken=6A5AA1D4...

💬 1

[Last reply:2 months ago] 这是由于 Edge-TTS 配音渠道连接微软服务器超时导致的。通常是因为网络不稳定、防火墙限制，或者你在没有代理的情况下直接访问了 Bing 语音服务（speech.platform.bing.com 在中国大陆可能被干扰）。解决方案：检查网络连接：确保你的网络可以正常访问外网。可以尝试在浏览器打开 https://speech.platform.bing.com 测试连通性。配置网络代理：如果你...

121.228* Posted at: 2 months ago

#4427 pyimod03_ctypes.install.<locals>.PyInstallerImportError: Failed to load dynlib/dll 'F:\\BaiduNetdiskDownload\\yy\\_internal\\azure\\cognitiveservices\\speech\\Microsoft.CognitiveSe...

💬 1

[Last reply:2 months ago] 无法加载 Azure TTS 所需的 Microsoft.CognitiveServices.Speech.core.dll，常见原因是使用了不完整的补丁包或系统缺少 VC++ 运行时组件。操作步骤：确认是否下载了完整软件包：若只下载了更新补丁包并覆盖，必须重新下载完整版解压，再覆盖最新补丁。完整版下载地址：https://pyvideotrans.com/downpackage安装微软 VC...

120.244* Posted at: 2 months ago

#4426 视频生成后模糊，不如原视频清晰，是怎么回事？软件会压缩画质吗？...

💬 1

[Last reply:2 months ago] 这是因为视频翻译过程中的重新编码操作会导致画质损失。软件内置了视频质量控制参数，默认值会带来一定压缩。若想尽可能保持原始画质，请依以下步骤调整：确保原始视频格式兼容：使用 H.264 编码的 MP4 文件。关闭会加重编码的选项：不要勾选“视频慢速”，并尽量避免嵌入硬字幕（可选用软字幕或不嵌入）。提升输出质量：进入菜单 → 工具/选项 → 高级选项 → 视频输出控制，将视频输出质量控制值降低（...

31.223* Posted at: 2 months ago

#4425 TaskCfgSTS(is_cuda=False, uuid='e5e740684f', cache_folder=None, target_dir='E:/Tool/pytransvideo/win-pyvideotrans-v3.99-428/output/translate', source_language=None, source_language...

💬 1

[Last reply:2 months ago] Lỗi này xảy ra do phía máy chủ của Gemini AI hiện đang quá tải (high demand). Đây là sự cố tạm thời, không liên quan đến cấu hình hay API key của bạn. Phần mềm đã thử tự động retry nhưng vẫn thất bại....

113.176* Posted at: 2 months ago

#4424 TaskCfgVTT(is_cuda=False, uuid='aaa1808b4c', cache_folder='D:/剪辑工具/tmp/6560/aaa1808b4c', target_dir='D:/视频素材/呋虫胺/_video_out/0cba840ec578cd4f5a261fbdf33e0791-mp4', source_language='...

💬 1

[Last reply:2 months ago] 这是因为你的网络环境无法直接访问 openai-whisper 模型下载服务器（openaipublic.azureedge.net），导致模型文件下载失败，语音识别中断。该问题在中国大陆地区非常常见。解决方案（按推荐顺序）：配置网络代理（如果你有代理服务）在主界面「网络代理地址」输入框中填写代理（格式如 http://127.0.0.1:10809）。代理生效后，软件即可正常下载模型。更...

240e:37b* Posted at: 2 months ago

#4422 TaskCfgVTT(is_cuda=False, uuid='ab16f7e93b', cache_folder='F:/win-pyvideotrans-v3.99-428/tmp/12660/ab16f7e93b', target_dir='D:/_video_out/c_28993850794-mp4', source_language='英语', ...

💬 1

[Last reply:2 months ago] 这是由于使用 Google(免费)翻译渠道时未配置网络代理所致。Google 服务在中国大陆无法直接访问，连接会被远程主机重置。解决方案（二选一）：配置网络代理（如果你有可用代理）在主界面右下角的“网络代理地址”输入框中填写代理地址，格式如 http://127.0.0.1:10808（端口号以你的代理客户端实际设置为准）。保存设置后重试。更换翻译渠道（无需代理）在主界面“翻译渠道”下拉菜单中选择...

240a:42ba* Posted at: 2 months ago

#4421 希望达成最佳的断句效果，即双语字幕的每种语言每次都不超过一行，且无过短字幕，字数和时长都适中且截断位置合理。如何设置才能达成最佳效果？分使用LLM断句和不使用LLM断句两种情况，提供两套对应情况的最佳设置...

💬 1

[Last reply:2 months ago] 断句效果不佳通常是因为语音识别的 VAD 参数设置不合理，或者模型未能合理划分句子。以下是针对是否使用 LLM 重新断句的两种优化方案。方案一：不使用 LLM 重新断句（调整语音识别与对齐参数）通过调整 VAD 和字幕合并参数，让识别阶段直接产生长度适中的字幕。在菜单栏 “工具/选项” → “高级选项” → “语音识别参数” 中修改：最长语音持续秒数：设为 6（避免单句过长）。最短语音持续毫秒：设...

103.3* Posted at: 2 months ago

#4420 TaskCfgVTT(is_cuda=True, uuid='63c1aba50c', cache_folder='D:/Downloads D/Tools/tmp/21924/63c1aba50c', target_dir='D:/Downloads D/Video/_video_out/如何花 1小时让你每月赚 3000 美元 - 抖音_3-mp4'...

💬 1

[Last reply:2 months ago] The error Unable to open file 'model.bin' indicates that the large-v3-turbo model for faster-whisper is incomplete or missing. Usually this happens because the automatic download from Huggin...

117.2* Posted at: 2 months ago

#523 openai.APIStatusError: Error code: 402 - {'error': {'message': 'Insufficient Balance', 'type': 'unknown_error', 'param': None, 'code': 'invalid_request_error'}}...

💬 3

[Last reply:2 months ago] 这是由于 DeepSeek API 账户余额不足导致的 402 错误，与软件设置无关。解决方案：充值你的 DeepSeek API 账户，或更换其他有余额的 API Key。若不急于使用 DeepSeek，可在主界面将“翻译渠道”临时切换为其他免费渠道（如 Edge-TTS 对应的翻译请改为 Microsoft、Google 等）。关于“LLM 并发设置”：软件中没有名为“LLM 并发”的独立开...

119.34* Posted at: 9 months ago

#4419 软件能支持AND ROCm 加速...

💬 1

[Last reply:2 months ago] AMD ROCm 加速不支持，pyVideoTrans 仅支持 NVIDIA 显卡的 CUDA 加速（要求 CUDA 12.8 及 cuDNN 9.11+），AMD/Intel 显卡无法使用 GPU 加速。第二个报错 FileNotFoundError: 'video_人民的嘉豪_0-mp4/end.ass' 是因为字幕文件未正确生成，通常由视频路径或文件名导致。请按以下步...

183.57* Posted at: 2 months ago

#4418 识别出的字幕有时会出现很长一段集中在同一时间的情况...

💬 1

[Last reply:2 months ago] 这是由于语音识别时未合理限制单个语音片段的最大长度导致的。默认设置下，最长语音持续秒数为6秒，如果该值过大，会将长段对话误判为一条字幕，集中显示。解决方案：打开软件，点击菜单栏工具/选项 → 高级选项。找到语音识别参数区域，将最长语音持续秒数修改为一个较小的值（例如 6 秒，不要超过30秒）。修改后，超过该时长的语音会被强制切分。同时检查语音阈值，建议设为 0.5 左右；静音分割持续毫...

114.47* Posted at: 2 months ago

#4417 主要识别语言:英语，日语，俄语电脑配置CPU:AMD R5 3600GPU:RTX 3060 12G记忆体:32G以上条件哪个模型最精准或更快?...

💬 1

[Last reply:2 months ago] 由于您主要识别英语、日语、俄语，且 RTX 3060 12GB 显存运行 large-v3 较为紧张，最均衡的方案是使用 faster-whisper 的 large-v3-turbo 模型，它保持了高准确率且资源消耗低于标准 large-v3。具体建议：语音识别渠道选择 faster-whisper(本地)，模型选择 large-v3-turbo（若日语识别较多可尝试 medium，但要兼顾俄语...

114.47* Posted at: 2 months ago

#4332 最短语音持续毫秒3000，最长语音持续秒数10，静音分割持续毫秒140，这个配置可以使语音识别出的句子都是完整的，但每行字幕会很长，有没有什么方法，比如通过提示词，将识别出的原始字幕可以按标点断句？...

💬 6

[Last reply:2 months ago] 导致 LLM 重新断句变慢，通常是因为模型请求耗时增加，与 DeepSeek V4 模型本身推理速度、你的请求并发数或网络延迟有关。可以尝试以下方法：降低每批字幕行数：在工具/选项 → 高级选项中调低 LLM重新断句每批字幕行数（例如从 20 调至 10 或 5），减少单次请求长度，加快单批处理速度。限制翻译并发：检查翻译后暂停秒数和并发翻译线程数（高级选项 → 字幕翻译调整），适当增加...

2409:8a55* Posted at: 2 months ago

#4416 elevenlabs.core.api_error.ApiError: headers: {'date': 'Mon, 04 May 2026 07:44:52 GMT', 'server': 'uvicorn', 'content-length': '119', 'content-type': 'application/json', 'vary': 'Ac...

💬 1

[Last reply:2 months ago] The error occurs because the ElevenLabs TTS model ID eleven_multilingual_ttv_v2 does not exist (likely a typo – the real model name is eleven_multilingual_v2 or similar). FixFind the correct model ID...

2404:c0* Posted at: 2 months ago

#4434 Response(id='resp_021778000716326e3c0010419774ef230e4bef6206f9366b2802d', created_at=1778000718.0, error=None, incomplet......

#4433 TaskCfgVTT(is_cuda=True, uuid='5c79baddaa', cache_folder='E:/3.98/tmp/3020/5c79baddaa', target_dir='D:/Course/The High-Density Coloring Guide to Bring Your Ideas to Life/SECTION 06...

#4432 KeyError: 'code'...

#4430 为什么设置了最长语音持续秒数为4或5这样的值，最后输出的字幕还是会有8秒9秒的超长字幕...

#4431 Auth Deppl secret required...

#4428 合并于输出这一步卡了30分钟还没完成...

#4429 aiohttp.client_exceptions.ConnectionTimeoutError: Connection timeout to host wss://speech.platform.bing.com/consumer/speech/synthesize/readaloud/edge/v1?TrustedClientToken=6A5AA1D4...

#4427 pyimod03_ctypes.install.<locals>.PyInstallerImportError: Failed to load dynlib/dll 'F:\\BaiduNetdiskDownload\\yy\\_internal\\azure\\cognitiveservices\\speech\\Microsoft.CognitiveSe...

#4426 视频生成后模糊，不如原视频清晰，是怎么回事？软件会压缩画质吗？...

#4425 TaskCfgSTS(is_cuda=False, uuid='e5e740684f', cache_folder=None, target_dir='E:/Tool/pytransvideo/win-pyvideotrans-v3.99-428/output/translate', source_language=None, source_language...

#4424 TaskCfgVTT(is_cuda=False, uuid='aaa1808b4c', cache_folder='D:/剪辑工具/tmp/6560/aaa1808b4c', target_dir='D:/视频素材/呋虫胺/_video_out/0cba840ec578cd4f5a261fbdf33e0791-mp4', source_language='...

#4422 TaskCfgVTT(is_cuda=False, uuid='ab16f7e93b', cache_folder='F:/win-pyvideotrans-v3.99-428/tmp/12660/ab16f7e93b', target_dir='D:/_video_out/c_28993850794-mp4', source_language='英语', ...

#4420 TaskCfgVTT(is_cuda=True, uuid='63c1aba50c', cache_folder='D:/Downloads D/Tools/tmp/21924/63c1aba50c', target_dir='D:/Downloads D/Video/_video_out/如何花 1小时 让你 每月赚 3000 美元 - 抖音_3-mp4'...

#523 openai.APIStatusError: Error code: 402 - {'error': {'message': 'Insufficient Balance', 'type': 'unknown_error', 'param': None, 'code': 'invalid_request_error'}}...

#4419 软件能支持AND ROCm 加速...

#4418 识别出的字幕有时会出现很长一段集中在同一时间的情况...

#4417 主要识别语言:英语，日语，俄语电脑配置CPU:AMD R5 3600GPU:RTX 3060 12G记忆体:32G以上条件哪个模型最精准或更快?...

#4332 最短语音持续毫秒3000，最长语音持续秒数10，静音分割持续毫秒140，这个配置可以使语音识别出的句子都是完整的，但每行字幕会很长，有没有什么方法，比如通过提示词，将识别出的原始字幕可以按标点断句？...

#4416 elevenlabs.core.api_error.ApiError: headers: {'date': 'Mon, 04 May 2026 07:44:52 GMT', 'server': 'uvicorn', 'content-length': '119', 'content-type': 'application/json', 'vary': 'Ac...

Related resource

#4420 TaskCfgVTT(is_cuda=True, uuid='63c1aba50c', cache_folder='D:/Downloads D/Tools/tmp/21924/63c1aba50c', target_dir='D:/Downloads D/Video/_video_out/如何花 1小时让你每月赚 3000 美元 - 抖音_3-mp4'...