-
#4318 翻译字幕阶段出错[DeepSeek]内容太长超出最大允许Token,请减小内容或增大max_token,或者降低每次发送字幕行数Could not parse response content as the length limit was...
💬 1[Last reply:2 hours ago] DeepSeek 返回“内容太长超出最大允许 Token”,说明当前单次提交给翻译接口的文本长度超过了该模型的上下文限制。解决方案降低 “AI翻译渠道每批字幕行数”进入菜单 工具/选项 → 高级选项 → 字幕翻译调整,将 AI翻译渠道每批字幕行数 改为 5~10(默认可能较大),减少每次发送的字幕量。取消 “发送完整字...5.34* Posted at: 2 hours ago -
#4317 高级选项的内容保存之后,下次打开某些数据又恢复原来的设置了...
💬 1[Last reply:2 hours ago] 这通常是旧版本中的一个配置保存 Bug 导致的,v3.99 已修复该问题。解决方案:升级至最新版本 v3.99。下载完整包后解压覆盖,或直接使用最新补丁包更新。确保软件存放路径不含中文或特殊符号(如空格),推荐放置在 D:\pyVideoTrans 等纯英文目录。若仍出现该问题,尝试右键 sp.exe 以管理员身份运行...104.238* Posted at: 2 hours ago -
#4312 比如双语字幕中,英文字幕如果过长,会自动换行,能不能取消这个设定,不管多长都不要最后合成双语字幕时自动换行...
💬 7[Last reply:4 hours ago] 两个最直接的达成路径:转录时直接生成纯文本:如果你还没开始处理,或想重新跑一次,请在左侧功能区切换到 批量语音转字幕 面板。在面板中找到 输出格式 / 字幕格式 区域,勾选 TXT文本(或取消勾选 SRT,仅勾选 TXT)。这样识别/翻译完成后,生成的 .txt 文件就是无时间轴的纯文稿。从已有 SRT 字幕转换:如果...2409:8a55* Posted at: 7 hours ago -
#4316 TaskCfgVTT(is_cuda=True, uuid='8e7c680f78', cache_folder='D:/ruanjian/win-pyvideotrans-v3.99-420/tmp/10096/8e7c680f78', ...
💬 1[Last reply:4 hours ago] 报错原因:本地 Qwen3-TTS 模型不支持泰语配音,其支持的语言列表为 ['auto', 'chinese', 'english', 'french', 'german', 'italian', ...103.172* Posted at: 4 hours ago -
#4315 TaskCfgVTT(is_cuda=True, uuid='e670583605', cache_folder='D:/win-pyvideotrans-v3.99-420/tmp/17460/e670583605', target_di...
💬 1[Last reply:4 hours ago] OmniVoice 服务端抛出了异常,但它的 Gradio 应用没有开启详细错误报告,因此无法直接看到具体错误参数。pyVideoTrans v3.99 已适配 OmniVoice 新增的必选参数 instruct,如果你的软件版本低于 v3.99 就会出现此类错误。解决方案:从官网重新下载最新的 v3.99 完整包:...104.238* Posted at: 4 hours ago -
#4314 TaskCfgVTT(is_cuda=True, uuid='00d7d8c483', cache_folder='D:/win-pyvideotrans-v3.99-420/tmp/17460/00d7d8c483', target_di...
💬 1[Last reply:6 hours ago] [WinError 10061] 连接被拒绝,说明软件无法连接到你在本地部署的 OmniVoice-TTS 服务。这是步骤:确认 OmniVoice-TTS 的服务端正在运行(启动它的终端窗口不能关闭)。通常它是一个基于 Gradio 的 WebUI,默认地址类似 http://127.0.0.1:7860。在 pyV...172.96* Posted at: 6 hours ago -
#4313 speech_recognition.exceptions.RequestError: recognition connection failed: [WinError 10060] 由于连接方在一段时间后没有正确答复或连接的主机没有反应,...
💬 3[Last reply:7 hours ago] faster-whisper(本地) 是软件默认的语音识别渠道,位于主界面「语音识别」行右侧的下拉框中。正常情况下启动软件后,下拉框的第一项(默认选中项)就是 faster-whisper(本地)。如果你没有看到该选项,请检查:软件是否为完整包(不要使用仅升级补丁包),可尝试重新下载完整版解压到新目录运行。语言界面是否...240e:338* Posted at: 7 hours ago -
#4311 TaskCfgSTS(is_cuda=False, uuid='b3ba860941', cache_folder=None, target_dir='E:/PH', source_language=None, source_languag...
💬 1[Last reply:7 hours ago] This error is caused by sending an excessively large translation request to the AI model, exceeding its maximum output token limit. The model hit its max_tokens...202.150* Posted at: 7 hours ago -
#4310 使用本地faster-whisper进行转录的时候可以租用云端GPU运行吗?...
💬 5[Last reply:8 hours ago] 暂无法提供 AutoDL 的专项一键部署脚本,但您可参照 Linux 源码部署流程,在 AutoDL 实例中手动搭建环境。基本步骤如下:租用实例:在 AutoDL 选择含 NVIDIA 显卡、显存 ≥10GB(推荐 16G+)、预装 CUDA 12.8 的镜像,或租用后自行安装 CUDA 12.8 和 cuDNN 9....5.34* Posted at: 8 hours ago -
#4309 对音频翻译能把字幕嵌入音频吗,我分部处理翻译音频-音频与视频合并...
💬 3[Last reply:8 hours ago] 知识库中未提供不同人声分离模型的效果对比与推荐。建议直接使用默认模型进行分离;如果效果不佳,可在 菜单 → 工具 → 高级选项 → 分离背景声模型 中切换其他模型测试。请查阅相关文档:分离人声和背景音...38.244* Posted at: 9 hours ago -
#4308 TaskCfgSTT(is_cuda=True, uuid='793e70d1b5', cache_folder='E:/ytrans/tmp/13092/793e70d1b5', target_dir='E:/ytrans/output/...
💬 1[Last reply:9 hours ago] CUDA out of memory during faster-whisper speech recognition, because the large-v3-turbo model requires more VRAM than your GPU can provide (minimum ~8–10GB for ...202.150* Posted at: 9 hours ago -
#4279 为什么语音识别阶段老是识别一半就不干活了?...
💬 5[Last reply:10 hours ago] 根据日志,错误由“人声背景声分离”功能引发,配置异常导致失败。 解决方案:暂时关闭分离功能:在主界面取消勾选“设置更多参数”里的“分离人声背景声”,重试看看能否正常完成识别和翻译。若仍要使用,请检查模型配置:菜单 → 工具/选项 → 高级选项 → “分离背景声模型”,确保已正确选择可用的模型(如 htdemucs 或...240e:355* Posted at: 1 day ago -
#4307 opening input: Invalid data found when processing input opening input file D:/win-pyvideotrans-v3.99-420/tmp/45072/srt17...
💬 1[Last reply:12 hours ago] 这是由于当前任务生成的字幕文件(SRT)损坏或格式不符合规范,导致 ffmpeg 在合成阶段无法读取。原因字幕可能包含乱码、格式错误,或在多线程处理时发生写入冲突,导致文件内容不完整。步骤如下强制重新处理:在软件主界面勾选 清理已生成 复选框,然后重新执行任务,强制丢弃旧缓存并重新生成字幕。检查字幕路径与长度:确保原视...2409:8a55* Posted at: 12 hours ago -
#4306 decoding subtitles: Invalid data found when processing input number -1145393733 occurred) number -1145393733 occurred)...
💬 1[Last reply:12 hours ago] 该错误通常是因为视频文件内嵌了非标准或损坏的字幕流,或者视频文件路径/名称包含特殊字符(如表情、空格)或过长,导致内部字幕解码失败。请按以下步骤排查:将视频文件移动到一个浅层、全英文短路径的目录(如 D:\temp),并将文件名改为简短的英文(如 test.mp4)。在软件主界面勾选 “清理已生成”,然后重新处理该视频...2409:8a55* Posted at: 12 hours ago -
#4305 字幕位置为什么很不稳定...
💬 5[Last reply:18 hours ago] 软字幕支持样式,但取决于封装格式和播放器。如 SRT 格式仅含纯文本,而 ASS/SSA 格式可携带字体、颜色、位置等样式信息。在 pyVideoTrans 中嵌入软字幕时,软件会将字幕转为 ASS 格式并封装,因此您可以像硬字幕一样在“修改硬字幕样式”编辑器中设置样式,效果会应用到软字幕中。不过,最终显示效果还需播放...2409:8a55* Posted at: 22 hours ago -
#4304 ValueError: The elements of the batch contain different keys. Cannot batch them ({'attention_mask', 'input_features', 'i...
💬 1[Last reply:22 hours ago] 这个错误是由于 HuggingFace_ASR 语音识别渠道在处理音频时,数据批次(batch)中的元素键名不一致导致的。简单说,部分音频片段返回了 num_frames 字段,而其他片段没有,导致批处理失败。通常与音频长度差异过大、模型内部处理不一致或兼容性问题有关。解决方案:更换语音识别渠道:这是最直接的解决方法。...38.244* Posted at: 22 hours ago -
#4303 日文语音转录用哪个模型,怎么样在选项界面设置,能使字幕字数最多...
💬 1[Last reply:22 hours ago] 日文语音转录推荐使用 HuggingFace_ASR 渠道,选择针对日语优化的模型。要让生成的每一条字幕包含更多文字(减少断句),需要调整语音活动检测(VAD)相关参数。推荐模型免费本地模型:HuggingFace_ASR → 选择 kotoba-whisper(专为日语设计的 Whisper 微调模型)或 reazo...38.244* Posted at: 22 hours ago -
#4302 无法连接当前api...
💬 1[Last reply:22 hours ago] 无法连接API通常由网络问题、代理未设置或API密钥/地址配置错误引起。检查网络代理:如果你在中国大陆使用海外服务(Google、OpenAI、Gemini等),需要配置代理。在主界面“网络代理地址”填入 http://127.0.0.1:xxxx(xxxx为代理端口),留空默认直连。确认API地址和密钥:前往菜单栏对...67.209* Posted at: 22 hours ago -
#4301 TaskCfgSTT(is_cuda=True, uuid='5a504ecb90', cache_folder='D:/win-pyvideotrans-v3.99-420/tmp/11380/5a504ecb90', target_di...
💬 1[Last reply:23 hours ago] Faster-Whisper-XXL 作为外部独立程序,在 PyInstaller 打包的 .exe 中运行时会因环境隔离、依赖缺失等原因无法正常调用。该渠道仅支持在源码部署下使用,或将其作为独立工具先转录出字幕再导入。解决方案(二选一)改用源码部署运行 pyVideoTrans按照官方文档 Mac/Linux 或 W...38.135* Posted at: 23 hours ago -
#4300 如何验证cuda和cuDNN是否已安装成功?...
💬 1[Last reply:23 hours ago] 在 Windows 上验证 CUDA 和 cuDNN 是否成功安装,请打开命令提示符 (CMD) 并执行以下命令:检查 CUDA 版本 输入 nvcc -V,如果能显示比如 release 12.8 之类的版本信息,说明 CUDA 工具包已正确安装并可被系统找到。若提示“不是内部或外部命令”,则需确认 CUDA 的 ...2409:8a55* Posted at: 23 hours ago
Open source and free maintenance is not easy. If this project is helpful to you, please consider making a small donation to help the project continue to maintain and update.