-
#4320 TaskCfgVTT(is_cuda=True, uuid='12e409df79', cache_folder='F:/win-pyvideotrans-v3.99-418/tmp/30472/12e409df79', target_di...
💬 1[Last reply:15 days ago] 这是CUDA计算库执行失败,通常与显存不足、CUDA/cuDNN环境版本不兼容或驱动异常有关。当前使用了 openai-whisper(本地) 的 large-v3 模型,且开启了CUDA加速(is_cuda=True),很可能因显存压力或库冲突导致 cublasLtMatmul 运算失败。请按以下步骤逐一排查:降低显...220.246* Posted at: 15 days ago -
#4312 比如双语字幕中,英文字幕如果过长,会自动换行,能不能取消这个设定,不管多长都不要最后合成双语字幕时自动换行...
💬 13[Last reply:15 days ago] 是的,你的推断完全正确。关于时间轴的固定性:在不开启二次识别且不做任何人工修改的前提下,字幕的时间轴严格由第一步“语音识别”阶段决定。翻译和配音阶段只会根据原始语音识别出的字幕序号和时间戳,填入新的配音音频。除非勾选了强制变速选项(如配音加速),否则这些时间戳的起止点本身不会因为配音内容变短而自动缩短。关于字幕滞留的成...2409:8a55* Posted at: 15 days ago -
#4319 生成的字幕有很多“啊”哦嗯等语气词...
💬 1[Last reply:15 days ago] 识别结果中包含大量语气词(如“啊”、“哦”、“嗯”)通常是因为语音活动检测(VAD)的阈值设置过低,导致将短暂的非语义声音当成了有效语音。解决方法:打开 菜单 → 工具/选项 → 高级选项,定位到 语音识别参数 区域。适当 提高“语音阈值”(例如改为 0.6 或 0.7),让模型只保留更有把握的语音片段。增大 “最短语...240e:39e* Posted at: 15 days ago -
#4318 翻译字幕阶段出错[DeepSeek]内容太长超出最大允许Token,请减小内容或增大max_token,或者降低每次发送字幕行数Could not parse response content as the length limit was...
💬 1[Last reply:15 days ago] DeepSeek 返回“内容太长超出最大允许 Token”,说明当前单次提交给翻译接口的文本长度超过了该模型的上下文限制。解决方案降低 “AI翻译渠道每批字幕行数”进入菜单 工具/选项 → 高级选项 → 字幕翻译调整,将 AI翻译渠道每批字幕行数 改为 5~10(默认可能较大),减少每次发送的字幕量。取消 “发送完整字...5.34* Posted at: 15 days ago -
#4317 高级选项的内容保存之后,下次打开某些数据又恢复原来的设置了...
💬 1[Last reply:15 days ago] 这通常是旧版本中的一个配置保存 Bug 导致的,v3.99 已修复该问题。解决方案:升级至最新版本 v3.99。下载完整包后解压覆盖,或直接使用最新补丁包更新。确保软件存放路径不含中文或特殊符号(如空格),推荐放置在 D:\pyVideoTrans 等纯英文目录。若仍出现该问题,尝试右键 sp.exe 以管理员身份运行...104.238* Posted at: 15 days ago -
#4316 TaskCfgVTT(is_cuda=True, uuid='8e7c680f78', cache_folder='D:/ruanjian/win-pyvideotrans-v3.99-420/tmp/10096/8e7c680f78', ...
💬 1[Last reply:15 days ago] 报错原因:本地 Qwen3-TTS 模型不支持泰语配音,其支持的语言列表为 ['auto', 'chinese', 'english', 'french', 'german', 'italian', ...103.172* Posted at: 15 days ago -
#4315 TaskCfgVTT(is_cuda=True, uuid='e670583605', cache_folder='D:/win-pyvideotrans-v3.99-420/tmp/17460/e670583605', target_di...
💬 1[Last reply:15 days ago] OmniVoice 服务端抛出了异常,但它的 Gradio 应用没有开启详细错误报告,因此无法直接看到具体错误参数。pyVideoTrans v3.99 已适配 OmniVoice 新增的必选参数 instruct,如果你的软件版本低于 v3.99 就会出现此类错误。解决方案:从官网重新下载最新的 v3.99 完整包:...104.238* Posted at: 15 days ago -
#4314 TaskCfgVTT(is_cuda=True, uuid='00d7d8c483', cache_folder='D:/win-pyvideotrans-v3.99-420/tmp/17460/00d7d8c483', target_di...
💬 1[Last reply:15 days ago] [WinError 10061] 连接被拒绝,说明软件无法连接到你在本地部署的 OmniVoice-TTS 服务。这是步骤:确认 OmniVoice-TTS 的服务端正在运行(启动它的终端窗口不能关闭)。通常它是一个基于 Gradio 的 WebUI,默认地址类似 http://127.0.0.1:7860。在 pyV...172.96* Posted at: 15 days ago -
#4313 speech_recognition.exceptions.RequestError: recognition connection failed: [WinError 10060] 由于连接方在一段时间后没有正确答复或连接的主机没有反应,...
💬 3[Last reply:15 days ago] faster-whisper(本地) 是软件默认的语音识别渠道,位于主界面「语音识别」行右侧的下拉框中。正常情况下启动软件后,下拉框的第一项(默认选中项)就是 faster-whisper(本地)。如果你没有看到该选项,请检查:软件是否为完整包(不要使用仅升级补丁包),可尝试重新下载完整版解压到新目录运行。语言界面是否...240e:338* Posted at: 15 days ago -
#4311 TaskCfgSTS(is_cuda=False, uuid='b3ba860941', cache_folder=None, target_dir='E:/PH', source_language=None, source_languag...
💬 1[Last reply:15 days ago] This error is caused by sending an excessively large translation request to the AI model, exceeding its maximum output token limit. The model hit its max_tokens...202.150* Posted at: 15 days ago -
#4310 使用本地faster-whisper进行转录的时候可以租用云端GPU运行吗?...
💬 5[Last reply:15 days ago] 暂无法提供 AutoDL 的专项一键部署脚本,但您可参照 Linux 源码部署流程,在 AutoDL 实例中手动搭建环境。基本步骤如下:租用实例:在 AutoDL 选择含 NVIDIA 显卡、显存 ≥10GB(推荐 16G+)、预装 CUDA 12.8 的镜像,或租用后自行安装 CUDA 12.8 和 cuDNN 9....5.34* Posted at: 15 days ago -
#4309 对音频翻译能把字幕嵌入音频吗,我分部处理翻译音频-音频与视频合并...
💬 3[Last reply:15 days ago] 知识库中未提供不同人声分离模型的效果对比与推荐。建议直接使用默认模型进行分离;如果效果不佳,可在 菜单 → 工具 → 高级选项 → 分离背景声模型 中切换其他模型测试。请查阅相关文档:分离人声和背景音...38.244* Posted at: 15 days ago -
#4308 TaskCfgSTT(is_cuda=True, uuid='793e70d1b5', cache_folder='E:/ytrans/tmp/13092/793e70d1b5', target_dir='E:/ytrans/output/...
💬 1[Last reply:15 days ago] CUDA out of memory during faster-whisper speech recognition, because the large-v3-turbo model requires more VRAM than your GPU can provide (minimum ~8–10GB for ...202.150* Posted at: 15 days ago -
#4307 opening input: Invalid data found when processing input opening input file D:/win-pyvideotrans-v3.99-420/tmp/45072/srt17...
💬 1[Last reply:15 days ago] 这是由于当前任务生成的字幕文件(SRT)损坏或格式不符合规范,导致 ffmpeg 在合成阶段无法读取。原因字幕可能包含乱码、格式错误,或在多线程处理时发生写入冲突,导致文件内容不完整。步骤如下强制重新处理:在软件主界面勾选 清理已生成 复选框,然后重新执行任务,强制丢弃旧缓存并重新生成字幕。检查字幕路径与长度:确保原视...2409:8a55* Posted at: 15 days ago -
#4306 decoding subtitles: Invalid data found when processing input number -1145393733 occurred) number -1145393733 occurred)...
💬 1[Last reply:15 days ago] 该错误通常是因为视频文件内嵌了非标准或损坏的字幕流,或者视频文件路径/名称包含特殊字符(如表情、空格)或过长,导致内部字幕解码失败。请按以下步骤排查:将视频文件移动到一个浅层、全英文短路径的目录(如 D:\temp),并将文件名改为简短的英文(如 test.mp4)。在软件主界面勾选 “清理已生成”,然后重新处理该视频...2409:8a55* Posted at: 15 days ago -
#4305 字幕位置为什么很不稳定...
💬 5[Last reply:16 days ago] 软字幕支持样式,但取决于封装格式和播放器。如 SRT 格式仅含纯文本,而 ASS/SSA 格式可携带字体、颜色、位置等样式信息。在 pyVideoTrans 中嵌入软字幕时,软件会将字幕转为 ASS 格式并封装,因此您可以像硬字幕一样在“修改硬字幕样式”编辑器中设置样式,效果会应用到软字幕中。不过,最终显示效果还需播放...2409:8a55* Posted at: 16 days ago -
#4304 ValueError: The elements of the batch contain different keys. Cannot batch them ({'attention_mask', 'input_features', 'i...
💬 1[Last reply:16 days ago] 这个错误是由于 HuggingFace_ASR 语音识别渠道在处理音频时,数据批次(batch)中的元素键名不一致导致的。简单说,部分音频片段返回了 num_frames 字段,而其他片段没有,导致批处理失败。通常与音频长度差异过大、模型内部处理不一致或兼容性问题有关。解决方案:更换语音识别渠道:这是最直接的解决方法。...38.244* Posted at: 16 days ago -
#4303 日文语音转录用哪个模型,怎么样在选项界面设置,能使字幕字数最多...
💬 1[Last reply:16 days ago] 日文语音转录推荐使用 HuggingFace_ASR 渠道,选择针对日语优化的模型。要让生成的每一条字幕包含更多文字(减少断句),需要调整语音活动检测(VAD)相关参数。推荐模型免费本地模型:HuggingFace_ASR → 选择 kotoba-whisper(专为日语设计的 Whisper 微调模型)或 reazo...38.244* Posted at: 16 days ago -
#4302 无法连接当前api...
💬 1[Last reply:16 days ago] 无法连接API通常由网络问题、代理未设置或API密钥/地址配置错误引起。检查网络代理:如果你在中国大陆使用海外服务(Google、OpenAI、Gemini等),需要配置代理。在主界面“网络代理地址”填入 http://127.0.0.1:xxxx(xxxx为代理端口),留空默认直连。确认API地址和密钥:前往菜单栏对...67.209* Posted at: 16 days ago -
#4301 TaskCfgSTT(is_cuda=True, uuid='5a504ecb90', cache_folder='D:/win-pyvideotrans-v3.99-420/tmp/11380/5a504ecb90', target_di...
💬 1[Last reply:16 days ago] Faster-Whisper-XXL 作为外部独立程序,在 PyInstaller 打包的 .exe 中运行时会因环境隔离、依赖缺失等原因无法正常调用。该渠道仅支持在源码部署下使用,或将其作为独立工具先转录出字幕再导入。解决方案(二选一)改用源码部署运行 pyVideoTrans按照官方文档 Mac/Linux 或 W...38.135* Posted at: 16 days ago
Open source and free maintenance is not easy. If this project is helpful to you, please consider making a small donation to help the project continue to maintain and update.