-
#4389 完全相同的参数,每次翻译完的结果会不一样,如何保证稳定...
💬 9[Last reply:1 month ago] LLM 重新断句的核心任务是优化字幕的语义连贯性和断句结构,并非专门设计用于修正离谱的错误单词。它的处理流程是:读取 SRT 中的原始文本,利用大语言模型对上下文的理解,将零散的短句合并或拆分成长度适宜的完整句子,并同步调整时间轴。在这个过程中,LLM 可能会顺带根据上下文自动修正部分明显的同音错别字或不通顺的表述,但这属于非确定性行为。如果识别错误过于严重(如完全错误的单词),LLM 通常无法可...103.172* Posted at: 1 month ago -
#4206 克隆音色,怎么不支持上传本地音色,好像没有批量处理,右边字幕只能上传一个视频的吗?想节约时间,提前修改好字幕这样节省时间,但是没有批量处理的...
💬 15[Last reply:1 month ago] AI感强和断句突兀通常是由语音识别时的字幕切分策略、配音语速/停顿处理不当导致的。可针对性地调整以下参数,让最终音频更加自然流畅。减少句间停顿、使衔接更连贯移除配音前后静音缓冲:进入菜单 → 工具 → 高级选项 → 字幕配音调整,勾选 “移除配音前后静音缓冲”。这会裁剪掉每条配音开头和结尾的静音,使句子衔接更紧凑(但结尾可能稍显仓促,请根据效果取舍)。调整静音分割持续毫秒:进入菜单 → 工具 → ...74.48* Posted at: 1 month ago -
#4390 TaskCfgSTT(is_cuda=True, uuid='707d968762', cache_folder='E:/PyVideoTrans v3.99(Subtitle generation and translation software)/tmp/3036/707d968762', target_dir='E:/PyVideoTrans v3.9...
💬 1[Last reply:1 month ago] 这是由 NVIDIA 50 系列显卡(Blackwell 架构)与 CUDA 库不兼容导致的 cuBLAS 调用失败。解决方案:确认已安装 CUDA 12.8 和 cuDNN 9.11(与软件内置版本匹配)。在软件菜单中进入 工具/选项 → 高级选项,将 CUDA数据类型 改为 float16 或 int8。仍然不行时,在系统环境变量中添加以下项并重启软件:变量名:CUBLAS_WORKSPACE...14.153* Posted at: 1 month ago -
#4388 采样温度具体说一下作用...
💬 3[Last reply:1 month ago] 采样温度在 pyVideoTrans 文档中未明确列出默认值,但依据 Whisper 系列模型的标准做法,该值通常默认为 0.0(即完全确定性解码)。在实际使用中,保持软件默认值即可,一般情况下无需调整;若遇到频繁的重复输出,可尝试将此值略微调高(如 0.2~0.5)。...103.172* Posted at: 1 month ago -
#4387 cli模式怎样批量合并视频和字幕?...
💬 1[Last reply:1 month ago] CLI模式目前不支持【工具】【视频与字幕合并】的批量操作。其支持的任务类型仅包含语音转录(stt)、文字转语音(tts)、字幕翻译(sts)和视频翻译(vtv),未提供视频与字幕的混流功能。如需批量合并视频和字幕,请使用图形界面的“工具 -> 视频与字幕合并”完成,或自行编写调用 FFmpeg 的批处理脚本。...216.195* Posted at: 1 month ago -
#4386 TaskCfgSTT(is_cuda=True, uuid='aa9e13113a', cache_folder='E:/haokang/win-pyvideotrans-v3.91_20251220_225815/tmp/10568/aa9e13113a', target_dir='E:/haokang/win-pyvideotrans-v3.91_202...
💬 1[Last reply:1 month ago] 这是由于软件缺少 qwen_asr 模块,通常是因使用了不完整的补丁包或环境损坏导致的。解决方案:重新下载最新完整版:前往 pyvideotrans.com/downpackage 获取 v3.99 完整软件包(.7z 压缩包),不要只下载补丁。正确解压:将完整包解压到非系统盘、无中文和特殊符号的路径(例如 D:\pyVideoTrans),不要直接覆盖到旧版本文件夹。清理旧缓存:在解压后的新软件...34.177* Posted at: 1 month ago -
#4385 TaskCfg(cache_folder='D:/My Softwares/视频翻译配音 Pyvideotran 3.96/tmp/9728/5c77fab096', target_dir='E:/迅雷下载/_video_out/床上丽拉 2026-mp4', remove_noise=False, is_separate=False, detect_lan...
💬 1[Last reply:1 month ago] 这是由文件路径含有中文、空格或特殊符号导致的。软件在尝试创建并写入 ko.srt 文件时,因为目标路径可能无法正常创建,从而抛出 FileNotFoundError。解决方法:将视频文件移动到纯英文(无中文、空格、特殊符号)的短路径下,例如 E:\video\input.mp4。在软件中重新选择该视频,并确保输出目录也使用类似简洁路径(点击“输出到..”按钮单独设置,不要使用自动带原视频名的复杂文...120.217* Posted at: 1 month ago -
#4384 TaskCfgVTT(is_cuda=True, uuid='1e2b9bb1a7', cache_folder='D:/win-pyvideotrans-v3.98-314/tmp/18908/1e2b9bb1a7', target_dir='C:/课程/《STAAD.Pro澳洲规范钢结构设计教程》/_video_out/1、Creating Physic...
💬 1[Last reply:1 month ago] 这是显存或内存不足导致的进程崩溃。错误发生在整个视频同时发送给faster-whisper进行识别时(_overall.py 的 _faster 函数),因为您开启了 二次识别 (recogn2pass=True) 并选择了 large-v3-turbo 模型,在CUDA加速下双任务并发加剧了显存消耗。请按顺序尝试以下方案:立即取消“二次识别” 关闭主界面“配音渠道”行右侧的 二次识别 开关。该...218.48* Posted at: 1 month ago -
#4383 TaskCfgSTT(is_cuda=True, uuid='90e5c416ef', cache_folder='E:/win-pyvideotrans-v3.99-428/tmp/15200/90e5c416ef', target_dir='E:/_pyVideotrans Output/recogn', source_language=None, so...
💬 1[Last reply:1 month ago] 由于输入视频文件路径中含有中文和空格,导致 FFmpeg 命令行在创建输出文件时失败(Invalid argument)。这在 Windows 系统中尤为常见,即使路径被引号包围也可能触发编码兼容性问题。解决方案将原始视频 E:/0DayDown/教程_Tutorials/Unreal/Verse Bootcamp UEFN Academy/2 - Core Basics/4. Operators...103.172* Posted at: 1 month ago -
#4382 submitting packet to decoder: Invalid data found when processing input submitting packet to decoder: Invalid data found when processing input submitting packet to decoder: Invalid ...
💬 1[Last reply:1 month ago] 这是 FFmpeg 解码输入文件时遇到损坏或无法识别的数据 所致。错误信息 Invalid data found when processing input 表明视频文件 A:/kasi1111/01.mp4 可能已损坏、编码异常,或存放在不稳定的磁盘(如网络驱动器、移动硬盘)上导致读取数据错误。请按以下步骤排查:将视频复制到本地磁盘(如 D 盘根目录),并将文件名改为简短的英文/数字,例如 D:...91.243* Posted at: 1 month ago -
#4381 openai.NotFoundError: Error code: 404 - {'detail': 'Not Found'}...
💬 1[Last reply:1 month ago] This is caused by an incorrect API endpoint or model name for the OpenAI TTS service. The 404 error indicates the requested resource was not found on the server.Verify that you have correctly filled i...2405:4802* Posted at: 1 month ago -
#4380 videotrans.configure._except.StopRetry: Could not fetch config for http://127.0.0.1:8880/v1/audio/speech/...
💬 1[Last reply:1 month ago] 错误源于 OmniVoice 服务未正确启动或 API 地址配置有误,导致 pyVideoTrans 无法获取 Gradio 服务的配置文件。解决方案:确认 OmniVoice 服务已在终端中启动,并保持运行状态,没有报错。检查 pyVideoTrans 中 OmniVoice 的 API 地址设置:菜单 -> TTS设置 -> F5-TTS界面(OmniVoice 复用此设置)应填写...119.39* Posted at: 1 month ago -
#4379 TaskCfgTTS(is_cuda=False, uuid='095993aa84', cache_folder='/Users/junyouchen/Desktop/pyvideotrans/tmp/5965/095993aa84', target_dir='/Users/junyouchen/Downloads', source_language=No...
💬 1[Last reply:1 month ago] 这是 pyVideoTrans 中 piper TTS(本地) 模块的内部代码缺陷(UnboundLocalError),变量 e 在异常捕获前未被赋值就直接使用。解决方案:临时绕开此错误:在主界面更换配音渠道,推荐使用 Edge-TTS(免费且稳定),或部署其他本地 TTS 如 CosyVoice、GPT-SoVITS 等。升级到最新代码:你是 macOS 源码部署的,请在项目目录执行:git ...51.75* Posted at: 1 month ago -
#4378 TaskCfgTTS(is_cuda=False, uuid='77de970a7c', cache_folder='/Users/junyouchen/Desktop/pyvideotrans/tmp/5965/77de970a7c', target_dir='/Users/junyouchen/Downloads', source_language=No...
💬 1[Last reply:1 month ago] 这是由 Piper TTS 内部代码缺陷,以及文件路径含有中文特殊符号共同导致的错误。核心原因:UnboundLocalError: local variable 'e' referenced before assignment 是 Piper TTS 模块的一个代码 Bug。程序企图在出错时引用错误变量,但因为文件路径问题,程序在执行初期就陷入异常,导致这个 Bug 暴露了出...51.75* Posted at: 1 month ago -
#4377 TaskCfgVTT(is_cuda=True, uuid='11339c2d22', cache_folder='C:/398/tmp/18108/11339c2d22', target_dir='C:/Users/trise/Downloads/_video_out/0428-mp4', source_language='Simplified Chine...
💬 1[Last reply:1 month ago] The error is due to insufficient GPU video memory when using the medium model with CUDA enabled, made worse by the enabled "二次识别" (recogn2pass) option which doubles memory usage.Disable "二次识别" On the...84.17* Posted at: 1 month ago -
#4376 LLM重新断句的结果,主要受哪些参数设置的影响...
💬 7[Last reply:1 month ago] 字幕对齐主要在视频翻译的最后合成阶段执行,即在配音完成后、最终视频输出前。具体过程包括以下环节:配音加速 / 视频慢速:当配音时长与原画不对应时,软件根据主界面的勾选项自动加速配音或放慢视频,强制匹配原片段时长。对齐字幕声音:若不使用配音加速或视频慢速,可勾选此项强制对齐字幕与配音的时间轴。二次识别:若勾选,软件会在配音完成后对整个配音音频再次进行语音识别,生成时间轴精准匹配配音的新字幕,确保字幕...103.172* Posted at: 1 month ago -
#4375 openai.LengthFinishReasonError: Could not parse response content as the length limit was reached - CompletionUsage(completion_tokens=916, prompt_tokens=3180, total_tokens=4096, com...
💬 1[Last reply:1 month ago] Translation failed because the AI model reached its token limit. The prompt (3180 tokens) plus the allowed completion length caused a 4096 total token cap to be exceeded, truncating the output and mak...2405:4802* Posted at: 1 month ago -
#4374 dubbing speedup esta deixando a voz robotica...
💬 1[Last reply:1 month ago] The robotic voice occurs because the "Dubbing Speedup" option forces synthesized audio to accelerate beyond natural limits, causing distortion. This typically happens when translated speech is signifi...191.6* Posted at: 1 month ago -
#4373 TaskCfgVTT(is_cuda=False, uuid='3f8c4968c8', cache_folder='C:/Users/HAMZA/Desktop/doblag youtube/win-pyvideotrans-v3.99-428/tmp/6932/3f8c4968c8', target_dir='doblaj 1-mp4', source_...
💬 1[Last reply:1 month ago] This is caused by the space in your video file path. The subprocess call to ffprobe fails because the path C:/Users/HAMZA/Desktop/capcut vidio/doblaj 1.mp4 contains spaces and the command is not prope...105.159* Posted at: 1 month ago -
#4372 TaskCfgVTT(is_cuda=True, uuid='617e6c9a85', cache_folder='D:/win-pyvideotrans-v3.99-428/tmp/2152/617e6c9a85', target_dir='G:/John Templeton/_video_out/John Templeton On Finding Tru...
💬 1[Last reply:1 month ago] 该错误是由于 CUDA 显卡被其他程序占用、显存不足或当前 GPU 状态不可用导致的。你的配置中开启了 CUDA 加速并选用了 large-v3 模型(需 10GB+ 显存),且启用了“二次识别”(recogn2pass=True),这会进一步推高显存占用。解决方案(按顺序尝试):关闭“二次识别”:在主界面右上角取消勾选“二次识别”复选框。该功能会在配音后再次调用语音识别,容易与首次识别争抢显存。...124.77* Posted at: 1 month ago
Open source and free maintenance is not easy. If this project is helpful to you, please consider making a small donation to help the project continue to maintain and update.