-
#4430 为什么设置了最长语音持续秒数为4或5这样的值,最后输出的字幕还是会有8秒9秒的超长字幕...
💬 9[Last reply:27 days ago] LLM 重新断句产生时间轴偏移,是因为模型重新生成了字幕的起止时间,而原始时间轴信息在断句时被修改或丢弃。这是其工作原理决定的,尤其在通过 LLM 重新切分合并句子时,若提示词未严格约束时间轴保持原样,极易出现偏差,即使使用最先进的模型也难完全避免。若你必须获得时间轴精准且长度合适的字幕,请按以下优先顺序尝试:方案一:放弃 LLM 重新断句,完全依靠 VAD + Whisper 预分割硬性控制时长...103.3* Posted at: 27 days ago -
#4431 Auth Deppl secret required...
💬 1[Last reply:27 days ago] This error occurs because you selected DeepL as the translation channel but did not provide an API key (Auth Key). DeepL requires authentication to use its translation service.How to fix:Obtain a Deep...2405:4802* Posted at: 27 days ago -
#4428 合并于输出这一步卡了30分钟还没完成...
💬 5[Last reply:28 days ago] 视频输出选项的默认设置如下(可在菜单栏“工具/选项-高级选项-视频输出控制”中查看和修改):视频输出质量控制:23(范围 0-51,值越小质量越高但视频越大,值越大质量越低文件越小)输出视频压缩率:fast(可选项 ultrafast / superfast / veryfast / faster / fast / medium / slow / slower / veryslow,速度越快画质越...94.177* Posted at: 28 days ago -
#4429 aiohttp.client_exceptions.ConnectionTimeoutError: Connection timeout to host wss://speech.platform.bing.com/consumer/speech/synthesize/readaloud/edge/v1?TrustedClientToken=6A5AA1D4...
💬 1[Last reply:28 days ago] 这是由于 Edge-TTS 配音渠道连接微软服务器超时导致的。通常是因为网络不稳定、防火墙限制,或者你在没有代理的情况下直接访问了 Bing 语音服务(speech.platform.bing.com 在中国大陆可能被干扰)。解决方案:检查网络连接:确保你的网络可以正常访问外网。可以尝试在浏览器打开 https://speech.platform.bing.com 测试连通性。配置网络代理:如果你...121.228* Posted at: 28 days ago -
#4427 pyimod03_ctypes.install.<locals>.PyInstallerImportError: Failed to load dynlib/dll 'F:\\BaiduNetdiskDownload\\yy\\_internal\\azure\\cognitiveservices\\speech\\Microsoft.CognitiveSe...
💬 1[Last reply:28 days ago] 无法加载 Azure TTS 所需的 Microsoft.CognitiveServices.Speech.core.dll,常见原因是使用了不完整的补丁包或系统缺少 VC++ 运行时组件。操作步骤:确认是否下载了完整软件包:若只下载了更新补丁包并覆盖,必须重新下载 完整版 解压,再覆盖最新补丁。完整版下载地址:https://pyvideotrans.com/downpackage安装微软 VC...120.244* Posted at: 28 days ago -
#4426 视频生成后模糊,不如原视频清晰,是怎么回事?软件会压缩画质吗?...
💬 1[Last reply:28 days ago] 这是因为视频翻译过程中的重新编码操作会导致画质损失。软件内置了视频质量控制参数,默认值会带来一定压缩。若想尽可能保持原始画质,请依以下步骤调整:确保原始视频格式兼容:使用 H.264 编码的 MP4 文件。关闭会加重编码的选项:不要勾选“视频慢速”,并尽量避免嵌入硬字幕(可选用软字幕或不嵌入)。提升输出质量:进入 菜单 → 工具/选项 → 高级选项 → 视频输出控制,将 视频输出质量控制 值降低(...31.223* Posted at: 28 days ago -
#4425 TaskCfgSTS(is_cuda=False, uuid='e5e740684f', cache_folder=None, target_dir='E:/Tool/pytransvideo/win-pyvideotrans-v3.99-428/output/translate', source_language=None, source_language...
💬 1[Last reply:28 days ago] Lỗi này xảy ra do phía máy chủ của Gemini AI hiện đang quá tải (high demand). Đây là sự cố tạm thời, không liên quan đến cấu hình hay API key của bạn. Phần mềm đã thử tự động retry nhưng vẫn thất bại....113.176* Posted at: 28 days ago -
#4424 TaskCfgVTT(is_cuda=False, uuid='aaa1808b4c', cache_folder='D:/剪辑工具/tmp/6560/aaa1808b4c', target_dir='D:/视频素材/呋虫胺/_video_out/0cba840ec578cd4f5a261fbdf33e0791-mp4', source_language='...
💬 1[Last reply:28 days ago] 这是因为你的网络环境无法直接访问 openai-whisper 模型下载服务器(openaipublic.azureedge.net),导致模型文件下载失败,语音识别中断。该问题在中国大陆地区非常常见。解决方案(按推荐顺序):配置网络代理(如果你有代理服务) 在主界面 「网络代理地址」 输入框中填写代理(格式如 http://127.0.0.1:10809)。代理生效后,软件即可正常下载模型。更...240e:37b* Posted at: 28 days ago -
#4422 TaskCfgVTT(is_cuda=False, uuid='ab16f7e93b', cache_folder='F:/win-pyvideotrans-v3.99-428/tmp/12660/ab16f7e93b', target_dir='D:/_video_out/c_28993850794-mp4', source_language='英语', ...
💬 1[Last reply:28 days ago] 这是由于使用 Google(免费)翻译渠道时未配置网络代理所致。Google 服务在中国大陆无法直接访问,连接会被远程主机重置。解决方案(二选一):配置网络代理(如果你有可用代理)在主界面右下角的“网络代理地址”输入框中填写代理地址,格式如 http://127.0.0.1:10808(端口号以你的代理客户端实际设置为准)。保存设置后重试。更换翻译渠道(无需代理)在主界面“翻译渠道”下拉菜单中选择...240a:42ba* Posted at: 28 days ago -
#4421 希望达成最佳的断句效果,即双语字幕的每种语言每次都不超过一行,且无过短字幕,字数和时长都适中且截断位置合理。如何设置才能达成最佳效果?分使用LLM断句和不使用LLM断句两种情况,提供两套对应情况的最佳设置...
💬 1[Last reply:28 days ago] 断句效果不佳通常是因为语音识别的 VAD 参数设置不合理,或者模型未能合理划分句子。以下是针对是否使用 LLM 重新断句的两种优化方案。方案一:不使用 LLM 重新断句(调整语音识别与对齐参数)通过调整 VAD 和字幕合并参数,让识别阶段直接产生长度适中的字幕。在菜单栏 “工具/选项” → “高级选项” → “语音识别参数” 中修改:最长语音持续秒数:设为 6(避免单句过长)。最短语音持续毫秒:设...103.3* Posted at: 28 days ago -
#4420 TaskCfgVTT(is_cuda=True, uuid='63c1aba50c', cache_folder='D:/Downloads D/Tools/tmp/21924/63c1aba50c', target_dir='D:/Downloads D/Video/_video_out/如何花 1小时 让你 每月赚 3000 美元 - 抖音_3-mp4'...
💬 1[Last reply:28 days ago] The error Unable to open file 'model.bin' indicates that the large-v3-turbo model for faster-whisper is incomplete or missing. Usually this happens because the automatic download from Huggin...117.2* Posted at: 28 days ago -
#523 openai.APIStatusError: Error code: 402 - {'error': {'message': 'Insufficient Balance', 'type': 'unknown_error', 'param': None, 'code': 'invalid_request_error'}}...
💬 3[Last reply:28 days ago] 这是由于 DeepSeek API 账户余额不足 导致的 402 错误,与软件设置无关。解决方案:充值你的 DeepSeek API 账户,或更换其他有余额的 API Key。若不急于使用 DeepSeek,可在主界面将“翻译渠道”临时切换为其他免费渠道(如 Edge-TTS 对应的翻译请改为 Microsoft、Google 等)。关于“LLM 并发设置”:软件中没有名为“LLM 并发”的独立开...119.34* Posted at: 8 months ago -
#4419 软件能支持AND ROCm 加速...
💬 1[Last reply:28 days ago] AMD ROCm 加速不支持,pyVideoTrans 仅支持 NVIDIA 显卡的 CUDA 加速(要求 CUDA 12.8 及 cuDNN 9.11+),AMD/Intel 显卡无法使用 GPU 加速。第二个报错 FileNotFoundError: 'video_人民的嘉豪_0-mp4/end.ass' 是因为字幕文件未正确生成,通常由视频路径或文件名导致。 请按以下步...183.57* Posted at: 28 days ago -
#4418 识别出的字幕有时会出现很长一段集中在同一时间的情况...
💬 1[Last reply:28 days ago] 这是由于语音识别时未合理限制单个语音片段的最大长度导致的。默认设置下,最长语音持续秒数为6秒,如果该值过大,会将长段对话误判为一条字幕,集中显示。解决方案:打开软件,点击菜单栏 工具/选项 → 高级选项。找到 语音识别参数 区域,将 最长语音持续秒数 修改为一个较小的值(例如 6 秒,不要超过30秒)。修改后,超过该时长的语音会被强制切分。同时检查 语音阈值,建议设为 0.5 左右;静音分割持续毫...114.47* Posted at: 28 days ago -
#4417 主要识别语言:英语,日语,俄语电脑配置CPU:AMD R5 3600GPU:RTX 3060 12G记忆体:32G以上条件哪个模型最精准或更快?...
💬 1[Last reply:29 days ago] 由于您主要识别英语、日语、俄语,且 RTX 3060 12GB 显存运行 large-v3 较为紧张,最均衡的方案是使用 faster-whisper 的 large-v3-turbo 模型,它保持了高准确率且资源消耗低于标准 large-v3。具体建议:语音识别渠道选择 faster-whisper(本地),模型选择 large-v3-turbo(若日语识别较多可尝试 medium,但要兼顾俄语...114.47* Posted at: 29 days ago -
#4332 最短语音持续毫秒3000,最长语音持续秒数10,静音分割持续毫秒140,这个配置可以使语音识别出的句子都是完整的,但每行字幕会很长,有没有什么方法,比如通过提示词,将识别出的原始字幕可以按标点断句?...
💬 6[Last reply:29 days ago] 导致 LLM 重新断句变慢,通常是因为模型请求耗时增加,与 DeepSeek V4 模型本身推理速度、你的请求并发数或网络延迟有关。可以尝试以下方法:降低每批字幕行数:在 工具/选项 → 高级选项 中调低 LLM重新断句每批字幕行数(例如从 20 调至 10 或 5),减少单次请求长度,加快单批处理速度。限制翻译并发:检查 翻译后暂停秒数 和 并发翻译线程数(高级选项 → 字幕翻译调整),适当增加...2409:8a55* Posted at: 1 month ago -
#4416 elevenlabs.core.api_error.ApiError: headers: {'date': 'Mon, 04 May 2026 07:44:52 GMT', 'server': 'uvicorn', 'content-length': '119', 'content-type': 'application/json', 'vary': 'Ac...
💬 1[Last reply:29 days ago] The error occurs because the ElevenLabs TTS model ID eleven_multilingual_ttv_v2 does not exist (likely a typo – the real model name is eleven_multilingual_v2 or similar). FixFind the correct model ID...2404:c0* Posted at: 29 days ago -
#4415 videotrans.util.help_ffmpeg._FFprobeInternalError: Command not found: ffmpeg. Ensure FFmpeg is installed and in your PATH....
💬 1[Last reply:29 days ago] 原因:系统找不到 ffmpeg 命令,导致程序无法继续。这通常是因为FFmpeg未安装,或软件包内的ffmpeg文件夹丢失/损坏,或环境变量未配置。解决步骤:确认软件包完整性:检查 sp.exe 同目录下是否存在 ffmpeg 文件夹,且其中包含 ffmpeg.exe 和 ffprobe.exe。如果缺失,请重新从官网下载完整软件包(.7z 压缩包),解压到非系统盘、非C盘、路径无中文的目录,再运...111.85* Posted at: 29 days ago -
#4414 videotrans.configure._except.StopRetry: [Errno 61] Connection refused...
💬 1[Last reply:29 days ago] Connection refused error means the OmniVoice TTS service is not running or not reachable at the configured address. The traceback shows pyVideoTrans cannot establish a connection to the OmniVoice API....2405:4802* Posted at: 29 days ago -
#4413 requests.exceptions.ProxyError: HTTPSConnectionPool(host='edge.microsoft.com', port=443): Max retries exceeded with url: /translate/auth (Caused by ProxyError('Unable to connect to...
💬 1[Last reply:29 days ago] 错误原因是软件中设置了网络代理地址,但该代理服务当前未运行或无法连接,导致微软翻译渠道请求失败。请按以下步骤解决:在软件主界面找到“网络代理地址”文本框。将文本框中的内容全部清空(删除 http://127.0.0.1:xxxx 等字符)。如果必须使用代理,请先确保代理软件(如 Clash、v2rayN)已正常开启,并确认端口号正确。微软翻译渠道本身无需代理即可访问,建议直接留空。请查阅相关文档:...2408:8226* Posted at: 29 days ago
Open source and free maintenance is not easy. If this project is helpful to you, please consider making a small donation to help the project continue to maintain and update.