-
#4422 TaskCfgVTT(is_cuda=False, uuid='ab16f7e93b', cache_folder='F:/win-pyvideotrans-v3.99-428/tmp/12660/ab16f7e93b', target_dir='D:/_video_out/c_28993850794-mp4', source_language='英语', ...
💬 1[Last reply:1 month ago] 这是由于使用 Google(免费)翻译渠道时未配置网络代理所致。Google 服务在中国大陆无法直接访问,连接会被远程主机重置。解决方案(二选一):配置网络代理(如果你有可用代理)在主界面右下角的“网络代理地址”输入框中填写代理地址,格式如 http://127.0.0.1:10808(端口号以你的代理客户端实际设置为准)。保存设置后重试。更换翻译渠道(无需代理)在主界面“翻译渠道”下拉菜单中选择...240a:42ba* Posted at: 1 month ago -
#4421 希望达成最佳的断句效果,即双语字幕的每种语言每次都不超过一行,且无过短字幕,字数和时长都适中且截断位置合理。如何设置才能达成最佳效果?分使用LLM断句和不使用LLM断句两种情况,提供两套对应情况的最佳设置...
💬 1[Last reply:1 month ago] 断句效果不佳通常是因为语音识别的 VAD 参数设置不合理,或者模型未能合理划分句子。以下是针对是否使用 LLM 重新断句的两种优化方案。方案一:不使用 LLM 重新断句(调整语音识别与对齐参数)通过调整 VAD 和字幕合并参数,让识别阶段直接产生长度适中的字幕。在菜单栏 “工具/选项” → “高级选项” → “语音识别参数” 中修改:最长语音持续秒数:设为 6(避免单句过长)。最短语音持续毫秒:设...103.3* Posted at: 1 month ago -
#4420 TaskCfgVTT(is_cuda=True, uuid='63c1aba50c', cache_folder='D:/Downloads D/Tools/tmp/21924/63c1aba50c', target_dir='D:/Downloads D/Video/_video_out/如何花 1小时 让你 每月赚 3000 美元 - 抖音_3-mp4'...
💬 1[Last reply:1 month ago] The error Unable to open file 'model.bin' indicates that the large-v3-turbo model for faster-whisper is incomplete or missing. Usually this happens because the automatic download from Huggin...117.2* Posted at: 1 month ago -
#523 openai.APIStatusError: Error code: 402 - {'error': {'message': 'Insufficient Balance', 'type': 'unknown_error', 'param': None, 'code': 'invalid_request_error'}}...
💬 3[Last reply:1 month ago] 这是由于 DeepSeek API 账户余额不足 导致的 402 错误,与软件设置无关。解决方案:充值你的 DeepSeek API 账户,或更换其他有余额的 API Key。若不急于使用 DeepSeek,可在主界面将“翻译渠道”临时切换为其他免费渠道(如 Edge-TTS 对应的翻译请改为 Microsoft、Google 等)。关于“LLM 并发设置”:软件中没有名为“LLM 并发”的独立开...119.34* Posted at: 9 months ago -
#4419 软件能支持AND ROCm 加速...
💬 1[Last reply:1 month ago] AMD ROCm 加速不支持,pyVideoTrans 仅支持 NVIDIA 显卡的 CUDA 加速(要求 CUDA 12.8 及 cuDNN 9.11+),AMD/Intel 显卡无法使用 GPU 加速。第二个报错 FileNotFoundError: 'video_人民的嘉豪_0-mp4/end.ass' 是因为字幕文件未正确生成,通常由视频路径或文件名导致。 请按以下步...183.57* Posted at: 1 month ago -
#4418 识别出的字幕有时会出现很长一段集中在同一时间的情况...
💬 1[Last reply:1 month ago] 这是由于语音识别时未合理限制单个语音片段的最大长度导致的。默认设置下,最长语音持续秒数为6秒,如果该值过大,会将长段对话误判为一条字幕,集中显示。解决方案:打开软件,点击菜单栏 工具/选项 → 高级选项。找到 语音识别参数 区域,将 最长语音持续秒数 修改为一个较小的值(例如 6 秒,不要超过30秒)。修改后,超过该时长的语音会被强制切分。同时检查 语音阈值,建议设为 0.5 左右;静音分割持续毫...114.47* Posted at: 1 month ago -
#4417 主要识别语言:英语,日语,俄语电脑配置CPU:AMD R5 3600GPU:RTX 3060 12G记忆体:32G以上条件哪个模型最精准或更快?...
💬 1[Last reply:1 month ago] 由于您主要识别英语、日语、俄语,且 RTX 3060 12GB 显存运行 large-v3 较为紧张,最均衡的方案是使用 faster-whisper 的 large-v3-turbo 模型,它保持了高准确率且资源消耗低于标准 large-v3。具体建议:语音识别渠道选择 faster-whisper(本地),模型选择 large-v3-turbo(若日语识别较多可尝试 medium,但要兼顾俄语...114.47* Posted at: 1 month ago -
#4332 最短语音持续毫秒3000,最长语音持续秒数10,静音分割持续毫秒140,这个配置可以使语音识别出的句子都是完整的,但每行字幕会很长,有没有什么方法,比如通过提示词,将识别出的原始字幕可以按标点断句?...
💬 6[Last reply:1 month ago] 导致 LLM 重新断句变慢,通常是因为模型请求耗时增加,与 DeepSeek V4 模型本身推理速度、你的请求并发数或网络延迟有关。可以尝试以下方法:降低每批字幕行数:在 工具/选项 → 高级选项 中调低 LLM重新断句每批字幕行数(例如从 20 调至 10 或 5),减少单次请求长度,加快单批处理速度。限制翻译并发:检查 翻译后暂停秒数 和 并发翻译线程数(高级选项 → 字幕翻译调整),适当增加...2409:8a55* Posted at: 1 month ago -
#4416 elevenlabs.core.api_error.ApiError: headers: {'date': 'Mon, 04 May 2026 07:44:52 GMT', 'server': 'uvicorn', 'content-length': '119', 'content-type': 'application/json', 'vary': 'Ac...
💬 1[Last reply:1 month ago] The error occurs because the ElevenLabs TTS model ID eleven_multilingual_ttv_v2 does not exist (likely a typo – the real model name is eleven_multilingual_v2 or similar). FixFind the correct model ID...2404:c0* Posted at: 1 month ago -
#4415 videotrans.util.help_ffmpeg._FFprobeInternalError: Command not found: ffmpeg. Ensure FFmpeg is installed and in your PATH....
💬 1[Last reply:1 month ago] 原因:系统找不到 ffmpeg 命令,导致程序无法继续。这通常是因为FFmpeg未安装,或软件包内的ffmpeg文件夹丢失/损坏,或环境变量未配置。解决步骤:确认软件包完整性:检查 sp.exe 同目录下是否存在 ffmpeg 文件夹,且其中包含 ffmpeg.exe 和 ffprobe.exe。如果缺失,请重新从官网下载完整软件包(.7z 压缩包),解压到非系统盘、非C盘、路径无中文的目录,再运...111.85* Posted at: 1 month ago -
#4414 videotrans.configure._except.StopRetry: [Errno 61] Connection refused...
💬 1[Last reply:1 month ago] Connection refused error means the OmniVoice TTS service is not running or not reachable at the configured address. The traceback shows pyVideoTrans cannot establish a connection to the OmniVoice API....2405:4802* Posted at: 1 month ago -
#4413 requests.exceptions.ProxyError: HTTPSConnectionPool(host='edge.microsoft.com', port=443): Max retries exceeded with url: /translate/auth (Caused by ProxyError('Unable to connect to...
💬 1[Last reply:1 month ago] 错误原因是软件中设置了网络代理地址,但该代理服务当前未运行或无法连接,导致微软翻译渠道请求失败。请按以下步骤解决:在软件主界面找到“网络代理地址”文本框。将文本框中的内容全部清空(删除 http://127.0.0.1:xxxx 等字符)。如果必须使用代理,请先确保代理软件(如 Clash、v2rayN)已正常开启,并确认端口号正确。微软翻译渠道本身无需代理即可访问,建议直接留空。请查阅相关文档:...2408:8226* Posted at: 1 month ago -
#4412 PermissionError: [WinError 5] 拒绝访问。: '\\psf'...
💬 1[Last reply:1 month ago] 这是由于软件在 Windows 上的 虚拟机或特殊共享文件夹环境(\\psf) 中运行、且尝试直接在只读或多层虚拟映射路径(如 Mac 的 Downloads 文件夹映射)中创建文件时,因权限不足而导致的错误。\\psf 是 Parallels Desktop 等虚拟机用于访问 Mac 文件系统的特殊网络路径。软件无法在该路径下的共享文件夹内获得创建目录的完整权限。解决方法:将软件移至虚拟机本地磁...111.85* Posted at: 1 month ago -
#4411 [Errno 2] No such file or directory: '5月4日 (1)/zh-cn.wav'...
💬 1[Last reply:1 month ago] 此错误是因为视频文件路径或名称包含中文字符和空格等特殊符号,导致 ffmpeg 处理失败。从日志看,文件路径为 5月4日 (1)/zh-cn.wav,在 Windows 命令行中无法正确解析。解决方案:检查并简化路径:将视频文件移动到简短的英文路径下,例如 D:\video\input.mp4,不要包含中文、括号或空格。重命名文件:如果无法移动目录,至少将文件名改为纯英文和数字,例如 video1...27.26* Posted at: 1 month ago -
#4410 LLM重新断句后,字幕怎么被切分那么多行?...
💬 1[Last reply:1 month ago] LLM 重新断句由 AI 模型按语义自动拆分,会将长句切分为更短的段落以优化时间轴对齐,因此原本的行数可能增多,每行长度趋于均衡。该行为由 AI 模型自主决定,无法直接设定字数上限,但可尝试以下调整减轻过度切分:打开 菜单 → 工具/选项 → 高级选项,减小 “LLM重新断句每批字幕行数” 的值(例如从 20 改为 5),让 AI 每次处理的上下文更少,有时可避免过度拆分。更换更强大的 AI 渠道...2409:8a55* Posted at: 1 month ago -
#4409 TaskCfgVTT(is_cuda=False, uuid='5785f1d2b3', cache_folder='D:/BaiduNetdiskDownload/win-pyvideotrans-v3.99-428/tmp/226056/5785f1d2b3', target_dir='Tema1_Parte1-mp4', source_language...
💬 1[Last reply:1 month ago] 这是因为在最终合成视频、配音和字幕时,找不到必要文件 end.ass,通常由文件路径包含中文/空格、路径过长或临时文件生成失败导致。原因:输入视频路径 D:/sissy/Sissy-Phd 文件/博士课程资料/50460/tema 1/ 含有中文和空格,且整体路径较长,Windows 下容易导致文件访问异常。同时开启了“二次识别”(recogn2pass=True),可能增加资源消耗,加剧了临时文...2001:8a0* Posted at: 1 month ago -
#4408 3.99貌似不支持50系显卡,这是CUDA版本不匹配吗,不启用CUDA就正常...
💬 1[Last reply:1 month ago] 该错误是由于 NVIDIA 50 系显卡(如 RTX 5090)与当前 faster-whisper 库调用的 cuBLAS 版本不兼容所导致,属于已知问题,与 CUDA 版本匹配有关。解决方法(任选一种):正确安装或升级 CUDA 工具包 软件内置支持 CUDA 12.8 版本,要求与 cuDNN 9.11 或更高版本配合使用。请参考安装教程:Windows 上安装 CUDA12.8 和 cu...240e:341* Posted at: 1 month ago -
#4407 TaskCfgVTT(is_cuda=True, uuid='59ede03afb', cache_folder='C:/Users/DELL/Desktop/win-pyvideotrans-v3.98-329/tmp/14248/59ede03afb', target_dir='D:/video-in/康复评估/Basic Ankle & Foot As...
💬 1[Last reply:1 month ago] 错误原因:显存不足。模型 large-v3-turbo 在开启 CUDA 且同时执行“二次识别”时,显存占用过高导致进程崩溃。解决方案(按推荐顺序):关闭“二次识别”:在主界面右上角取消勾选“二次识别”,然后重试。更换更小的模型:将语音识别模型从 large-v3-turbo 改为 medium 或 small(可在模型下拉列表中选择)。调整高级选项降低显存占用:进入 菜单 → 工具/选项 → 高...27.207* Posted at: 1 month ago -
#4406 TaskCfgVTT(is_cuda=True, uuid='d9d918925d', cache_folder='D:/win-pyv/tmp/32780/d9d918925d', target_dir='G:/camp/31-Color_Grading_Workflow_Techniques_LUTs_and_More/_video_out/231-Ho...
💬 1[Last reply:1 month ago] 错误原因是 openai-whisper 在 GPU (CUDA) 解码时出现了 NaN 值,通常由显存不足或相关设置过高引起。日志中显示 recogn2pass=True(即启用了“二次识别”),这会额外消耗大量显存,导致当前 CUDA 计算崩溃。请按以下步骤操作(按顺序尝试):关闭二次识别:在主界面右上角,取消勾选 二次识别 选项,然后重新运行任务。使用更小的模型:将语音识别模型从 large...103.3* Posted at: 1 month ago -
#4404 翻译字幕阶段出错 [DeepSeek] 内容太长超出最大允许Token,请减小内容或增大max_token,或者降低每次发送字幕行数...
💬 1[Last reply:1 month ago] 核心原因:向 DeepSeek 发送的翻译请求(提示词+字幕内容)生成的输出 token 数超过了 DeepSeek API 允许的上限(默认可能为 8192),导致模型输出被截断并报错。解决方案(按顺序尝试):如果 DeepSeek 渠道设置面板中存在 max_token 参数,请打开菜单 → 翻译设置 → DeepSeek 设置,将其调大(例如设为 16384 或 32768)。在菜单 → 工...59.41* Posted at: 1 month ago
Open source and free maintenance is not easy. If this project is helpful to you, please consider making a small donation to help the project continue to maintain and update.
Dondate: ko-fi.com/jianchang512