-
#4499 aiohttp.client_exceptions.ConnectionTimeoutError: Connection timeout to host wss://speech.platform.bing.com/consumer/speech/synthesize/readaloud/edge/v1?TrustedClientToken=6A5AA1D4...
💬 1[Last reply:1 month ago] 连接超时是因为 Edge-TTS 被微软限流或网络不通。解决方案:降低并发数:点击菜单栏 工具/选项 → 高级选项 → 字幕配音调整,将 EdgeTTS 配音渠道配音并发数 改为 1,将 配音后暂停秒数 改为 5-10 秒。检查网络代理:如果在中国大陆,请确保主界面“网络代理地址”已正确填写(如 http://127.0.0.1:7890),或尝试更换代理节点。更换配音渠道:若持续失败,建议改用 ...114.220* Posted at: 1 month ago -
#4498 GPU同时任务数设置为多少好?具体含义是什么,影响fasterwhisper单任务速度吗?...
💬 5[Last reply:1 month ago] 开启“Whisper预分割音频”选项的主要目的是降低显存占用,尤其适用于长音频或显存不足的情况。它将长音频预先切割为短片段再送入Whisper模型,从而减少单次处理所需显存。对识别准确度:没有直接帮助,甚至可能因切断了上下文而导致准确度轻微下降(尤其是句子边界分割不当时)。但可避免因显存溢出导致的识别失败。对断句效果:有一定间接帮助。预先分割能强制将语音按静音等特征分段,配合调整“最短语音持续毫秒...103.3* Posted at: 1 month ago -
#4497 TaskCfgSTT(is_cuda=True, uuid='57da8ab8e2', cache_folder='J:/pyvideotrans-v3.99-0508/tmp/9564/57da8ab8e2', target_dir='J:/pyvideotrans-v3.99-0508/output/recogn', source_language=No...
💬 1[Last reply:1 month ago] 这是由于GPU计算不稳定或显存不足导致的,模型输出产生了无效值(NaN)。解决方案检查CUDA/cuDNN版本:确保已安装CUDA 12.8+和cuDNN 9.11+。在CMD运行 nvcc -V 查看CUDA版本,nvidia-smi 查看驱动支持的最高CUDA版本。临时关闭CUDA加速:在主界面取消勾选“CUDA加速”,改用CPU运行,若问题消失则确认是GPU环境问题。降低显卡负载:菜单栏 →...103.197* Posted at: 1 month ago -
#4496 Permission denied: C:/Users/halba/Desktop/How to Start a Faceless YouTube Channel in 2026/_video_out/How to Start a Faceless YouTube Channel in 2026-mp4/How to Start a Faceless You...
💬 1[Last reply:1 month ago] The error "Permission denied" indicates that pyVideoTrans cannot write to the target output directory. This is usually caused by one of the following:Path too long or contains problematic characters –...146.241* Posted at: 1 month ago -
#4495 这轮不再是“纯等待无返回”了,llm_segment 已经返回了一次断句结果:日志里出现了:[WARNING] [LLM re-segments] 重新断句结果: result=' ... '也就是说,大模型已经把一整段新的 SRT 切句结......
💬 1[Last reply:1 month ago] 这是正常的分批处理过程。LLM 重新断句功能会将较长的字幕列表分割成多批,依次发送给大模型进行断句优化,每批处理完毕后自动发起下一批请求。当前日志显示第一批已完成并返回结果,第二批正在发送等待返回,说明程序正在按预期工作,并非卡死。您可以在菜单→工具→高级选项→通用设置中调整LLM重新断句每批字幕行数(默认20),增大该值可减少批次数但可能增加单次请求失败风险。请继续等待后续批次处理完毕即可。如长...203.198* Posted at: 1 month ago -
#4494 开了 rephrase/llm_post,断句后处理在最后一步没正常结束。faster-whisper + resegment 组合上有收尾等待问题...
💬 1[Last reply:1 month ago] 这是LLM重新断句(rephrase)调用AI接口时卡住或未正常结束导致的。该功能需要连接AI渠道(如DeepSeek、OpenAI),若网络不稳定、API限流或提示词处理超时,最后一步会长时间等待。解决方案检查AI渠道配置:确保在菜单-翻译设置中填写了正确的API地址和Key(如DeepSeek、OpenAI),且网络代理(若需)已正确配置。降低批处理量:进入菜单-工具-高级选项,将“LLM重新...203.198* Posted at: 1 month ago -
#4493 TaskCfg(cache_folder='D:/BaiduNetdiskDownload/win-pyvideotrans-v3.92/tmp/11248/4379cefab3', target_dir='D:/_video_out/干针/What are the Differences Between Acupuncture and Dry Needli...
💬 1[Last reply:1 month ago] 这是磁盘空间不足导致的错误。你的 D: 盘空间满了,无法继续写入临时文件或输出视频。解决方案:立即清理磁盘空间:删除 D:/BaiduNetdiskDownload/win-pyvideotrans-v3.92/tmp/ 文件夹内的所有临时文件(这些是处理过程中产生的缓存,可安全删除)。检查 D: 盘剩余空间,确保至少留有数 GB 空闲。减少临时文件体积:你的配置中启用了 视频慢速(video_a...154.85* Posted at: 1 month ago -
#4492 TaskCfgSTT(is_cuda=True, uuid='abaad39e97', cache_folder='J:/软件/win-pyvideotrans-v3.99-0508/tmp/7516/abaad39e97', target_dir='J:/软件/win-pyvideotrans-v3.99-0508/output/recogn', sour...
💬 1[Last reply:1 month ago] ZeroDivisionError: division by zero 发生在语音识别重分段阶段,通常因音频被分割出的某个片段时长为零(或时间戳异常)导致,与 VAD 参数或音频文件本身有关。解决方案调整语音识别高级参数(菜单 → 工具/选项 → 高级选项 → 语音识别参数):将“最短语音持续毫秒”设为 2000 或 3000(避免过短片段)。将“静音分割持续毫秒”设为 500(减少误分割)。将“...2409:8a5c* Posted at: 1 month ago -
#4423 在最后嵌入视频背景声的时候怎么把视频背景声音改成自定义的...
💬 9[Last reply:1 month ago] 软件当前不支持直接对视频进行镜像翻转操作。该软件主要用于视频翻译、字幕处理、配音合成等流程,未包含视频画面镜像或旋转功能。如果需要镜像输出,建议使用 ffmpeg 等工具对原始视频预处理,命令示例:ffmpeg -i input.mp4 -vf hflip output.mp4(水平镜像)或 vflip(垂直镜像),处理后再导入软件进行翻译。...36.224* Posted at: 1 month ago -
#4491 文件名或路径可能太长了!X文件名的"总长度"较长,在后续复杂处理时可能超过系统限制而出错。当前文件名:95个字,路径加文件共:102个字为避免后续出错,建议:改短文件名,缩短文件夹的名字,将文件移动到更外层更简短的文件夹中。点击 Yes忽略......
💬 1[Last reply:1 month ago] 这是由于文件路径或名称过长,在后续处理(尤其是ffmpeg调用)时可能超过Windows系统的路径长度限制(通常260字符)。即使当前路径只有102字符,但软件在处理过程中会生成临时文件和嵌套目录,导致整体路径超出限制。解决方案:将视频文件移动到更浅的目录,例如 D:\videos 或桌面,避免多层文件夹嵌套。将视频文件名修改为简短的英文或数字名称(如 video1.mp4),去除特殊符号和空格。...103.127* Posted at: 1 month ago -
#4490 Ref Audio Missing: C:/pyvideotrans/f5-tts/nicdd.wav...
💬 1[Last reply:1 month ago] The error indicates that the reference audio file nicdd.wav is missing from the required directory C:/pyvideotrans/f5-tts/.Root Cause: You are using a TTS channel (F5-TTS, Index-TTS, VoxCPM, Spark-TT...103.139* Posted at: 1 month ago -
#4489 * To create a public link, set `share=True` in `launch()`....
💬 1[Last reply:1 month ago] 请确认具体问题。从日志看,OmniVoice TTS 服务已在 http://0.0.0.0:8081 启动成功。若是在 pyVideoTrans 中连接该服务,需在菜单 - TTS设置 - F5-TTS(OmniVoice共用该设置面板)中将API地址填写为 http://127.0.0.1:8081 或 http://localhost:8081,并确保参考音频已放置于软件目录下的f5-tts...88.192* Posted at: 1 month ago -
#4488 TaskCfg(cache_folder='D:/BaiduNetdiskDownload/win-pyvideotrans-v3.92/tmp/11248/3e259bbfa2', target_dir='D:/_video_out/干针/How Dry Needling the Teres Major and Minor Muscles Improves...
💬 1[Last reply:1 month ago] 语音识别未提取到字幕,主要原因是文件路径/名称过长或含特殊符号,以及未开启GPU加速导致处理超时/失败,或视频本身无有效人声。解决方案简化文件路径和名称将视频移动到浅目录(如 D:\video\test.mp4),文件名改短(纯英文+数字)。当前路径含中文“干针”及长标题,极易触发Windows路径限制。确保视频包含人声并选对语言确认视频确实有英语对话,且背景噪音不过大。可先用播放器试听。使用更小...111.14* Posted at: 1 month ago -
#4487 如图,右侧的字幕框不走了,然后中间的进程时间依旧,一直等了好久都没有完成,不知道哪里出了问题,试过中间的时间等到2万多秒...
💬 1[Last reply:1 month ago] 软件进程仍在运行但任务停滞,通常是资源耗尽或某阶段线程死锁,导致无法继续处理后续任务。解决方案:强制单任务串行:进入 菜单 → 工具/选项 → 高级选项,勾选 “批量翻译时强制串行”,这样每个视频完成后才会开始下一个,避免资源竞争。检查并清理缓存:重新处理前,在主界面勾选 “清理已生成”,避免重复读取旧缓存导致卡死。降低资源占用:语音识别模型改用 small 或 base(而非 large-v3)...113.117* Posted at: 1 month ago -
#4486 TaskCfg(cache_folder='D:/Program Files/win-pyvideotrans/tmp/40660/d7988e8c4c', target_dir='C:/Users/Juno/Desktop', remove_noise=False, is_separate=False, detect_language=None, subt...
💬 1[Last reply:1 month ago] gTTS 网络连接失败,原因是你在软件主界面中填写的网络代理地址无法连接(代理服务未运行或地址错误),导致请求被拒绝。解决方案:如果你的网络环境不需要代理(例如国内使用),请将主界面“网络代理地址”文本框清空。如果你确定需要使用代理,请检查代理服务是否已启动,并确认地址格式正确(如 http://127.0.0.1:7890),端口号需与代理客户端一致。注意:gTTS 依赖 translate.g...212.107* Posted at: 1 month ago -
#4485 原先使用完全没有问题,现在突然连接不上了...
💬 17[Last reply:1 month ago] 根据您提供的截图(Swagger文档页面),请查找页面中可用的 POST 接口路径。常见的路径有:如果看到 /tts(或类似 /api/tts),则在 pyVideoTrans 菜单 → TTS设置 → GPT-SoVITS 中,API URL 设置为 http://127.0.0.1:9880;如果看到 /v1/tts,则 API URL 设置为 http://127.0.0.1:9880/v1...172.105* Posted at: 1 month ago -
#4484 TaskCfgVTT(is_cuda=True, uuid='59909e932c', cache_folder='C:/pyvideo/tmp/12536/59909e932c', target_dir='X:/BaiduNetdiskDownload/CGT- CRAFTING BELIVALCE FACE/CGT1_CABF_W08/_video_ou...
💬 1[Last reply:1 month ago] 这是由于你的 OpenAI API 地址指向了一个第三方反向代理服务(如 openai_codex),该代理不支持 gpt-4o-transcribe 模型,导致返回 503 model_not_found。在软件菜单中选择 菜单 → 翻译设置 → OpenAI,检查 API URL 是否为官方地址 https://api.openai.com/v1。如果非官方,请改为官方地址。若你确实需要使用第...2408:8207* Posted at: 1 month ago -
#961 RuntimeError: cuBLAS failed with status CUBLAS_STATUS_NOT_SUPPORTED...
💬 7[Last reply:1 month ago] 这是因为 RTX 5070 Ti(Blackwell 架构)的 cuBLAS 库在 int8 量化计算上与 faster-whisper 内置的 int8_float16 混合精度模式不兼容,导致 cuBLAS 抛出 “NOT_SUPPORTED” 错误。 将 CUDA数据类型 改为 float16 后,所有运算都使用 GPU 原生支持的 半精度浮点数,不再调用不兼容的 int8 内核,因此可以...113.205* Posted at: 8 months ago -
#4483 No available channel for model gpt-4o-transcribe under group openai_codex逆向 (distributor) (request id: 202605081540215166543618268d9d6H4zFdrDe)...
💬 1[Last reply:1 month ago] 你遇到的这个错误是因为你在语音识别渠道中选择了 openai_codex(可能指 OpenAI 兼容接口)并指定了模型 gpt-4o-transcribe,但该模型在当前渠道下不可用——OpenAI 语音识别模型通常是 whisper-1,不是 gpt-4o-transcribe(后者是 OpenAI 聊天模型,不能用于语音转录)。解决步骤打开软件,进入主界面,找到语音识别渠道的下拉菜单。确认选择...2408:8207* Posted at: 1 month ago -
#4482 openai.InternalServerError: Error code: 503 - {'error': {'code': 'model_not_found', 'message': 'No available channel for model gpt-5.2 under group openai (distributor) (request id:...
💬 1[Last reply:1 month ago] 这是由于翻译渠道中填写的模型名称 gpt-5.2 在当前服务商(如 OpenAI 或兼容接口)中不存在或不可用。OpenAI 目前没有发布 gpt-5.2 模型,常见模型名称如 gpt-4o、gpt-4-turbo、gpt-3.5-turbo 等。解决方法:在软件菜单栏 翻译设置 → 对应 AI 翻译渠道中,将模型名称修改为服务商提供的正确模型名(例如 gpt-4o、deepseek-chat 等...2408:8207* Posted at: 1 month ago
Open source and free maintenance is not easy. If this project is helpful to you, please consider making a small donation to help the project continue to maintain and update.
Dondate: ko-fi.com/jianchang512