-
#4441 TaskCfgSTT(is_cuda=True, uuid='cba94326ed', cache_folder='E:/win-pyvideotrans-v3.99-428/tmp/82980/cba94326ed', target_di...
💬 1[Last reply:6 days ago] FFmpeg 将视频转换为 16k 音频时无法写入临时文件,最可能的原因是目标目录不存在或权限不足。关闭软件,找到 E:\win-pyvideotrans-v3.99-428 目录,右键 sp.exe → 选择“以管理员身份运行”。如果仍失败,请尝试在软件主界面中点击“输出到..”按钮,将输出目录修改到一个简单路径(例...129.128* Posted at: 6 days ago -
#4440 TaskCfgSTT(is_cuda=True, uuid='0d7a7de6c5', cache_folder='E:/win-pyvideotrans-v3.99-428/tmp/51880/0d7a7de6c5', target_di...
💬 1[Last reply:6 days ago] 文件路径中包含中文字符导致 ffmpeg 处理失败。从错误日志看,输入文件路径 F:/Z哥/250323大A成色.mp4 以及输出临时路径 E:/win-pyvideotrans-v3.99-428/tmp/.../250323大A成色-*.wav 均含有中文,而 ffmpeg 在 Windows 上对含有非 ASCI...129.128* Posted at: 6 days ago -
#4439 TaskCfgSTT(is_cuda=True, uuid='1fa895ca70', cache_folder='E:/win-pyvideotrans-v3.99-428/tmp/87192/1fa895ca70', target_di...
💬 1[Last reply:6 days ago] 这是 FFmpeg 在处理文件时,因输出路径无效导致的错误。通常是因为文件路径中包含特殊字符或不支持的命令行参数,导致无法创建输出文件 250323大A成色-1778032599.038524.wav。解决方法(按顺序尝试):将原视频文件 移动/重命名 为简短纯英文,路径不要有中文、空格或特殊符号(例如 F:\zge\...129.128* Posted at: 6 days ago -
#4438 TaskCfgSTT(is_cuda=True, uuid='e39c922b0e', cache_folder='E:/win-pyvideotrans-v3.99-428/tmp/85624/e39c922b0e', target_di...
💬 1[Last reply:6 days ago] 这是由于输出文件的路径中包含中文或过长导致的 ffmpeg 处理错误(Invalid argument)。Windows 下命令行对非 ASCII 字符和超长路径支持较差。解决方案:将视频文件重命名为简短的英文或数字名称(如 video1.mp4)。将视频移动到磁盘根目录下的浅层文件夹(如 D:\videos\),避免...129.128* Posted at: 6 days ago -
#4437 TaskCfg(cache_folder='D:/BaiduNetdiskDownload/win-pyvideotrans-v3.92/tmp/4276/6348e2dfe1', target_dir='D:/_video_out/营养学...
💬 1[Last reply:6 days ago] 这是由勾选了“视频慢速”功能导致的磁盘空间不足错误。该功能会将视频按字幕切割成大量临时片段,产生远超原视频体积的中间文件,最终占满硬盘。解决方案立即释放空间:手动删除软件根目录下的 tmp 文件夹内所有内容。正常关闭软件时也会自动清理。调整对齐策略:在主界面取消勾选 视频慢速,仅保留 配音加速,即可避免产生巨量临时文件...114.42* Posted at: 6 days ago -
#4436 TaskCfgVTT(is_cuda=True, uuid='7f383cf87d', cache_folder='C:/Users/Mike/Downloads/win-pyvideotrans-v3.99-428/tmp/18172/7...
💬 1[Last reply:6 days ago] 这是因为 Faster-Whisper-XXL 语音识别渠道当前不支持 Windows 预打包版,该渠道仅在源码部署(Linux/macOS)中可用,或需要你单独下载 Faster-Whisper-XXL 程序手动转录。解决方案(按推荐顺序):将语音识别渠道切换为 faster-whisper(本地) 或 openai...203.175* Posted at: 6 days ago -
#4435 TaskCfgVTT(is_cuda=True, uuid='92ecec3cbd', cache_folder='D:/shipinzhuanhuan/tmp/22048/92ecec3cbd', target_dir='E:/1688选...
💬 1[Last reply:6 days ago] 这是由当前显卡或CUDA环境不支持所请求的 int8_float16 / float16 计算类型导致的。faster-whisper 在启用CUDA加速时默认尝试更高效的数据类型,但你的设备或后端未完全兼容。解决方案(按顺序尝试):修改CUDA数据类型为float32 打开菜单:工具/选项 → 高级选项 → 找到 ...2409:8a44* Posted at: 6 days ago -
#4434 Response(id='resp_021778000716326e3c0010419774ef230e4bef6206f9366b2802d', created_at=1778000718.0, error=None, incomplet...
💬 1[Last reply:7 days ago] 不对。这完全是豆包模型的胡言乱语。AI 模型有时会因为解码错误而产生这种无意义的循环重复内容,请直接忽略。...103.3* Posted at: 7 days ago -
#4433 TaskCfgVTT(is_cuda=True, uuid='5c79baddaa', cache_folder='E:/3.98/tmp/3020/5c79baddaa', target_dir='D:/Course/The High-D...
💬 1[Last reply:7 days ago] This error indicates a memory allocation failure during the faster-whisper speech recognition step — either your system RAM or GPU VRAM is insufficient for the ...2405:4802* Posted at: 7 days ago -
#4432 KeyError: 'code'...
💬 1[Last reply:7 days ago] The translation failed because your custom translation API endpoint did not return the expected JSON field code. In TransAPI mode, pyVideoTrans requires the res...2405:4802* Posted at: 7 days ago -
#4430 为什么设置了最长语音持续秒数为4或5这样的值,最后输出的字幕还是会有8秒9秒的超长字幕...
💬 9[Last reply:7 days ago] LLM 重新断句产生时间轴偏移,是因为模型重新生成了字幕的起止时间,而原始时间轴信息在断句时被修改或丢弃。这是其工作原理决定的,尤其在通过 LLM 重新切分合并句子时,若提示词未严格约束时间轴保持原样,极易出现偏差,即使使用最先进的模型也难完全避免。若你必须获得时间轴精准且长度合适的字幕,请按以下优先顺序尝试:方案一:...103.3* Posted at: 7 days ago -
#4431 Auth Deppl secret required...
💬 1[Last reply:7 days ago] This error occurs because you selected DeepL as the translation channel but did not provide an API key (Auth Key). DeepL requires authentication to use its tran...2405:4802* Posted at: 7 days ago -
#4428 合并于输出这一步卡了30分钟还没完成...
💬 5[Last reply:7 days ago] 视频输出选项的默认设置如下(可在菜单栏“工具/选项-高级选项-视频输出控制”中查看和修改):视频输出质量控制:23(范围 0-51,值越小质量越高但视频越大,值越大质量越低文件越小)输出视频压缩率:fast(可选项 ultrafast / superfast / veryfast / faster / fast / m...94.177* Posted at: 7 days ago -
#4429 aiohttp.client_exceptions.ConnectionTimeoutError: Connection timeout to host wss://speech.platform.bing.com/consumer/spe...
💬 1[Last reply:7 days ago] 这是由于 Edge-TTS 配音渠道连接微软服务器超时导致的。通常是因为网络不稳定、防火墙限制,或者你在没有代理的情况下直接访问了 Bing 语音服务(speech.platform.bing.com 在中国大陆可能被干扰)。解决方案:检查网络连接:确保你的网络可以正常访问外网。可以尝试在浏览器打开 https://s...121.228* Posted at: 7 days ago -
#4427 pyimod03_ctypes.install.<locals>.PyInstallerImportError: Failed to load dynlib/dll 'F:\\BaiduNetdiskDownload\\yy\\_inter...
💬 1[Last reply:7 days ago] 无法加载 Azure TTS 所需的 Microsoft.CognitiveServices.Speech.core.dll,常见原因是使用了不完整的补丁包或系统缺少 VC++ 运行时组件。操作步骤:确认是否下载了完整软件包:若只下载了更新补丁包并覆盖,必须重新下载 完整版 解压,再覆盖最新补丁。完整版下载地址:htt...120.244* Posted at: 7 days ago -
#4426 视频生成后模糊,不如原视频清晰,是怎么回事?软件会压缩画质吗?...
💬 1[Last reply:7 days ago] 这是因为视频翻译过程中的重新编码操作会导致画质损失。软件内置了视频质量控制参数,默认值会带来一定压缩。若想尽可能保持原始画质,请依以下步骤调整:确保原始视频格式兼容:使用 H.264 编码的 MP4 文件。关闭会加重编码的选项:不要勾选“视频慢速”,并尽量避免嵌入硬字幕(可选用软字幕或不嵌入)。提升输出质量:进入 菜单...31.223* Posted at: 7 days ago -
#4425 TaskCfgSTS(is_cuda=False, uuid='e5e740684f', cache_folder=None, target_dir='E:/Tool/pytransvideo/win-pyvideotrans-v3.99-...
💬 1[Last reply:7 days ago] Lỗi này xảy ra do phía máy chủ của Gemini AI hiện đang quá tải (high demand). Đây là sự cố tạm thời, không liên quan đến cấu hình hay API key của bạn. Phần mềm ...113.176* Posted at: 7 days ago -
#4424 TaskCfgVTT(is_cuda=False, uuid='aaa1808b4c', cache_folder='D:/剪辑工具/tmp/6560/aaa1808b4c', target_dir='D:/视频素材/呋虫胺/_video_...
💬 1[Last reply:7 days ago] 这是因为你的网络环境无法直接访问 openai-whisper 模型下载服务器(openaipublic.azureedge.net),导致模型文件下载失败,语音识别中断。该问题在中国大陆地区非常常见。解决方案(按推荐顺序):配置网络代理(如果你有代理服务) 在主界面 「网络代理地址」 输入框中填写代理(格式如 ht...240e:37b* Posted at: 7 days ago -
#4422 TaskCfgVTT(is_cuda=False, uuid='ab16f7e93b', cache_folder='F:/win-pyvideotrans-v3.99-428/tmp/12660/ab16f7e93b', target_d...
💬 1[Last reply:7 days ago] 这是由于使用 Google(免费)翻译渠道时未配置网络代理所致。Google 服务在中国大陆无法直接访问,连接会被远程主机重置。解决方案(二选一):配置网络代理(如果你有可用代理)在主界面右下角的“网络代理地址”输入框中填写代理地址,格式如 http://127.0.0.1:10808(端口号以你的代理客户端实际设置为...240a:42ba* Posted at: 7 days ago -
#4421 希望达成最佳的断句效果,即双语字幕的每种语言每次都不超过一行,且无过短字幕,字数和时长都适中且截断位置合理。如何设置才能达成最佳效果?分使用LLM断句和不使用LLM断句两种情况,提供两套对应情况的最佳设置...
💬 1[Last reply:8 days ago] 断句效果不佳通常是因为语音识别的 VAD 参数设置不合理,或者模型未能合理划分句子。以下是针对是否使用 LLM 重新断句的两种优化方案。方案一:不使用 LLM 重新断句(调整语音识别与对齐参数)通过调整 VAD 和字幕合并参数,让识别阶段直接产生长度适中的字幕。在菜单栏 “工具/选项” → “高级选项” → “语音识别...103.3* Posted at: 8 days ago
Open source and free maintenance is not easy. If this project is helpful to you, please consider making a small donation to help the project continue to maintain and update.