-
#4174 TaskCfgVTT(is_cuda=True, uuid='51f23485d0', cache_folder='F:/win-pyvideotrans-v3.99-418/tmp/11392/51f23485d0', target_dir='F:/Math.Tutor.DVD.Complete.Collection.XviD/Math.Tutor.DVD...
💬 5[Last reply:2 months ago] 暂无法确定具体原因。请提供软件安装目录下的 logs/ 文件夹中最新的日志文件(复制底部约30行报错信息)以便分析。...103.3* Posted at: 2 months ago -
#4173 TaskCfgVTT(is_cuda=True, uuid='8424117e82', cache_folder='F:/win-pyvideotrans-v3.99-418/tmp/28592/8424117e82', target_dir='F:/Math.Tutor.DVD.Complete.Collection.XviD/Math.Tutor.DVD...
💬 1[Last reply:2 months ago] 这是由于 openai-whisper 模型文件下载不完整或损坏,导致 SHA256 校验失败。解决方案:手动清理并重新下载模型:前往软件安装目录下的 models/ 文件夹。删除与 openai-whisper 相关的模型文件夹(例如,包含 whisper 或 openai-whisper 字样的文件夹)。重新启动 pyVideoTrans,在语音识别阶段选择 openai-whisper(本地...103.3* Posted at: 2 months ago -
#4172 RuntimeError: 72891e6fe0 split no voice error:opening input: No such file or directory opening input file -hwaccel. opening input files: No such file or directory...
💬 1[Last reply:2 months ago] 这是由于视频文件路径过长或包含特殊符号,导致 ffmpeg 无法正确识别和处理文件。解决方案:缩短路径和文件名:将待处理的视频文件移动到更浅的目录(例如 D:\videos),并重命名为一个简短的英文或数字名称(例如 video.mp4)。检查特殊字符:确保文件名和路径中不包含 ?、*、表情符号等特殊字符。检查软件安装路径:确保 pyVideoTrans 软件本身也安装在路径较短且不含中文或特殊符...182.107* Posted at: 2 months ago -
#4171 RuntimeError: cc518ae941 split no voice error:opening input: No such file or directory opening input file -hwaccel. opening input files: No such file or directory...
💬 3[Last reply:2 months ago] 从日志看,OmniVoice-TTS 配音渠道工作正常,成功生成了配音文件。你之前遇到的 cc518ae941 split no voice error 错误发生在配音完成后的“音画对齐与合成”阶段,具体是在尝试从原始视频中分离无声视频时,ffmpeg 因文件路径问题而失败。核心原因:文件路径过长或包含特殊字符,导致 ffmpeg 命令行参数构建错误。解决方案:简化输入视频路径和名称:将需要翻译的...182.107* Posted at: 2 months ago -
#4170 如何让软件完全按照我提供的字幕进行配音?...
💬 9[Last reply:2 months ago] 在“设置更多参数”弹窗中,为了确保软件严格按照你提供的字幕进行配音(即跳过语音识别,直接使用已有字幕),关键设置如下:核心设置:分离人声背景声:不要勾选。此功能会触发对音频的处理,可能干扰直接使用字幕。恢复标点:不要勾选。此功能会对识别后的文本添加标点,而你已有字幕无需此操作。其他设置(根据你的需求调整):如果你希望基于已有字幕直接生成配音,那么“识别说话人”、“降噪”这两个选项都无需勾选。如果你...81.28* Posted at: 2 months ago -
#4169 TaskCfg(cache_folder=None, target_dir='F:/AI语音转文字/win-pyvideotrans-v3.91_20251220_225815/output/translate', remove_noise=False, is_separate=False, detect_language=None, subtitle_la...
💬 1[Last reply:2 months ago] 翻译字幕时,硅基流动AI模型返回了“内容太长超出最大允许Token”的错误。这是因为一次性发送的字幕内容超过了该AI模型的最大上下文长度限制。解决方案:减少每次发送的字幕行数:点击软件顶部菜单栏的 工具/选项 -> 高级选项。在“字幕翻译调整”区域,找到 AI翻译渠道每批字幕行数。将数值调小(例如从默认值调为 10 或 5),然后点击“保存”。取消“发送完整字幕”选项:如果主界面或高级选项中...2408:8220* Posted at: 2 months ago -
#4168 RuntimeError: Connection error....
💬 1[Last reply:2 months ago] 这是网络连接问题导致的翻译渠道请求失败。错误信息显示在使用“字节火山”翻译渠道时,远程主机强制关闭了连接。解决方案:检查网络代理:如果你在中国大陆地区,使用字节火山等国内服务通常无需代理。请检查主界面“网络代理地址”是否为空。如果填写了代理地址,请清空该字段。降低请求频率:在 菜单 -> 工具/选项 -> 高级选项 -> 字幕翻译调整 中,将“翻译后暂停秒”设置为一个较大的值(例...43.206* Posted at: 2 months ago -
#4167 videotrans.configure._except.StopRetry: models/gemini-1.5-flash-latest is not found for API version v1beta, or is not supported for generateContent. Call ListModels to see the list...
💬 1[Last reply:2 months ago] 这是因为你配置的 Gemini 模型名称 gemini-1.5-flash-latest 在当前 API 版本下不存在或不被支持。打开 pyVideoTrans 软件,点击顶部菜单栏的 翻译设置。在打开的设置窗口中,找到并点击 Gemini 标签页。检查 模型 输入框中的内容。你需要将其修改为当前 Gemini API 支持的有效模型名称。推荐模型:gemini-1.5-flash 或 gemin...2400:4050* Posted at: 2 months ago -
#4162 KeyError: 'km'...
💬 17[Last reply:2 months ago] 降噪功能用于在语音识别前,先消除音频中的环境噪声(如风声、电流声、背景音乐等),从而提升语音识别的准确率。是否推荐勾选,取决于你的原始视频/音频质量:推荐勾选的情况:原始音视频存在明显的环境噪音、背景音乐干扰或录音质量较差。不推荐勾选的情况:原始音视频人声清晰、背景干净,或者你追求最快的处理速度(因为降噪需要额外下载模型并增加处理时间)。操作位置:在主界面“语音识别”行右侧,有一个 降噪 复选框,...82.27* Posted at: 2 months ago -
#4166 我要翻译中文音频,给我最近最合适的配置参数,并且告知设置的位置在哪,还有推荐的模型选择...
💬 1[Last reply:2 months ago] 要翻译中文音频,推荐以下配置参数以获得最佳效果:一、语音识别 (ASR) 阶段渠道与模型:选择 qwen-asr(本地) 或 faster-whisper(本地) 的 large-v3 模型。qwen-asr 对中文支持效果较好。设置位置:在主界面“语音识别”行的下拉列表中选择。关键参数:发音语言:必须明确选择 中文。降噪:如果音频有背景噪音,勾选此项。高级选项(菜单 -> 工具/选项 -&...47.250* Posted at: 2 months ago -
#4165 在翻译视频或音频,可能是视频上普通话不标准,导致有些文字有很多错别字,这个怎么调整...
💬 3[Last reply:2 months ago] 这是由于说话人口齿不清导致语音识别模型难以准确解析。可以通过优化识别参数和预处理音频来改善。调整语音识别高级参数:点击 菜单 -> 工具/选项 -> 高级选项。在“语音识别参数”区域,进行以下调整:语音阈值:适当降低(例如从0.5改为0.3或0.2),让模型更“敏感”,尝试捕捉不清晰的语音。no speech threshold:适当降低(例如从默认值0.6改为0.4),减少模型因不确...47.250* Posted at: 2 months ago -
#4164 speech_recognition.exceptions.RequestError: recognition request failed: Service Unavailable...
💬 1[Last reply:2 months ago] 这是由于 Google 语音识别服务不可用导致的网络连接问题。解决方案:检查网络代理:如果你在中国大陆,使用 Google 服务需要配置网络代理。请确保主界面“网络代理地址”已正确填写(格式如 http://127.0.0.1:10808)。如果没有可用代理,请勿填写。切换语音识别渠道:Google 语音识别为在线服务,不稳定。建议改用本地识别渠道,如 faster-whisper(本地) 或 o...103.151* Posted at: 2 months ago -
#4163 原始视频是英文,第一句对白出现是第4秒开始的,但语音识别默认的时间是从0秒起开始的,后面倒是都没问题,但第一句对不上,什么原因...
💬 13[Last reply:2 months ago] 这是由于字幕编辑窗口的交互设计限制,当前版本中,在“单视频交互模式”弹出的编辑窗口里,确实无法直接通过点击或双击来修改字幕的“开始时间”和“结束时间”单元格。解决方案:直接编辑 SRT 文件(最有效):在语音识别阶段完成后,不要关闭弹出的字幕编辑窗口。在该窗口中,点击右下角的 保存 按钮,软件会生成一个临时的 .srt 字幕文件。使用系统自带的“记事本”或专业的字幕编辑器(如 Subtitle E...2409:8a55* Posted at: 2 months ago -
#4161 TaskCfgVTT(is_cuda=True, uuid='e6e9c2f4e7', cache_folder='E:/软件/win-pyvideotrans-v3.99-418/tmp/16876/e6e9c2f4e7', target_dir='F:/下载/哔哩哔哩视频/新建文件夹/01.金鹿号-mp4', source_language='英语', ...
💬 1[Last reply:2 months ago] 这是由于显存或内存不足导致的。错误信息明确指出在使用 faster-whisper(本地) 的 large-v3-turbo 模型时,GPU 进程池异常终止,原因是显存或内存不足。请按以下步骤尝试解决:降低模型大小:在主界面的语音识别渠道中,将模型从 large-v3-turbo 更换为更小的模型,例如 medium、small 或 base。large-v3-turbo 模型对显存和内存要求较高...171.92* Posted at: 2 months ago -
#4160 OSError: Error no file named pytorch_model.bin, model.safetensors, tf_model.h5, model.ckpt.index or flax_model.msgpack found in directory D:/APP/win-pyvideotrans-v3.98-0401/models/...
💬 1[Last reply:2 months ago] 这是 Qwen-TTS(本地) 配音渠道的模型文件下载不完整或缺失导致的错误。解决方案:检查模型目录:前往软件安装目录 D:/APP/win-pyvideotrans-v3.98-0401/models/,查看是否存在名为 models--Qwen--Qwen3-TTS-12Hz-1.7B-CustomVoice 的文件夹。手动下载模型:如果该文件夹存在,但内部缺少 pytorch_model.b...64.118* Posted at: 2 months ago -
#4154 无法正常调用GPU进行加速的问题...
💬 30[Last reply:2 months ago] 是的,根据截图和知识库信息,LLM重新断句功能目前不支持本地LLM。在 菜单 -> 工具/选项 -> 高级选项 的 【通用设置】 区域,“LLM重新断句所用AI渠道” 的下拉选项中只包含 openai 和 deepseek 两种在线AI渠道,没有本地LLM的选项。这意味着该功能目前只能调用配置了API Key的在线AI服务(如OpenAI或DeepSeek)来执行重新断句。如果您希望使...156.229* Posted at: 2 months ago -
#4159 [mov,mp4,m4a,3gp,3g2,mj2 @ 00000267be3504c0] moov atom not found F:/softwares/win-pyvideotrans-v3.96-22/tmp/4896/ab26504aef/novoice.mp4: Invalid data found when processing input...
💬 1[Last reply:2 months ago] 这是由于视频处理过程中生成的无声视频文件损坏导致的,具体表现为 moov atom not found 错误。解决方案:清理缓存并重试:在软件主界面左上角勾选 清理已生成 复选框,然后重新处理视频。这将强制软件重新生成所有中间文件。检查文件路径:确保输入视频的文件路径和名称简短且不含中文或特殊符号。建议将视频移动到浅层目录(如 D:\video.mp4)并重命名为纯英文或数字名称。检查磁盘空间:确...77.93* Posted at: 2 months ago -
#4158 pyvideotrans目录中包含有哪些提示词文件,这些提示词文件分别又对应的是哪些功能,如果我的需求是把v3.98的这些配置覆盖到3.99版本,我要覆盖哪些文件才行...
💬 5[Last reply:2 months ago] recharge-llm.txt 文件的主要内容是指导 AI 大模型(如 GPT、DeepSeek 等)如何对语音识别生成的字幕进行重新断句和优化的系统指令。其核心目的是:将识别出的、可能过长或过短、断句不自然的字幕,根据语义和语法规则,重新分割成更符合阅读习惯、长度更适宜的句子。该提示词文件通常会包含以下关键指令:任务定义:明确要求模型将提供的字幕文本重新断句。输入格式:说明输入是带有行号和时间...2409:8a55* Posted at: 2 months ago -
#4157 二次语音识别在什么情况下不会生效...
💬 1[Last reply:2 months ago] 二次语音识别(二次识别)在以下情况下不会生效:未选择配音:二次识别仅在“视频翻译”或“批量为字幕配音”功能中,选择了配音渠道并生成了配音音频后才会执行。如果只进行语音识别和翻译,不进行配音,则二次识别不会触发。未嵌入单字幕:在主界面中,如果字幕嵌入方式选择了“不嵌入字幕”、“嵌入硬字幕(双)”或“嵌入软字幕(双)”,二次识别不会生效。它仅在选择了“嵌入硬字幕”或“嵌入软字幕”(即单字幕)时才会启用...2409:8a55* Posted at: 2 months ago -
#4156 语音识别环节断句问题...
💬 5[Last reply:2 months ago] 这是“合并过短字幕”功能与原始音频语义切分之间的权衡结果。当您启用“合并过短字幕到邻近”后,软件会强制将过短的句子与相邻句子合并,以消除过短片段。合并的逻辑是基于时间相邻性,而非语义完整性,因此可能将原本语义独立但时间上接近的两句话合并成一句,从而导致合并后的字幕行时长变长(例如7-8秒)。要解决此问题,您需要调整“最长语音持续秒数”和“最短语音持续毫秒”的数值,找到一个平衡点。建议尝试以下步骤:...2409:8a55* Posted at: 2 months ago
Open source and free maintenance is not easy. If this project is helpful to you, please consider making a small donation to help the project continue to maintain and update.
Dondate: ko-fi.com/jianchang512