-
#4730 LLM重新断句 设置大模型API按钮在哪里,关闭后就找不到了...
💬 1[Last reply:6 days ago] LLM重新断句所用AI渠道的设置并非独立入口,它直接复用你已配置的 AI 翻译渠道(如 OpenAI、DeepSeek 等)的密钥与模型。 也就是说,你需要先确保在顶部菜单中对应渠道的配置面板已填写正确:点击顶部菜单 → 找到你选择的 AI 渠道名称(例如 DeepSeek AI、OpenAI ChatGPT、硅基流动 等)。在打开的设置窗口中填入 API Key、Base URL(若需)、模型...104.248* Posted at: 6 days ago -
#4729 videotrans.configure.excepts.StopTask: Error code: 404...
💬 3[Last reply:6 days ago] Gemini 翻译渠道的 Base URL 并未在软件知识库中直接列出,通常由 Google Gemini API 决定。建议您按以下步骤操作:打开软件顶部菜单:设置 → 翻译渠道设置 → Gemini AI。查看该配置界面中是否已自动填充 Base URL(例如 https://generativelanguage.googleapis.com/v1 或 https://generativela...206.189* Posted at: 6 days ago -
#4728 TaskCfgSTT(is_cuda=True, uuid='3ed8d5a232', cache_folder='F:/AI剪辑/tmp/15436/3ed8d5a232', target_dir='F:/AI剪辑/output/recogn', source_language=None, source_language_code=None, source...
💬 1[Last reply:6 days ago] 预处理阶段出错的原因:视频文件路径及文件名包含 #、空格、中文等特殊字符,导致 FFmpeg 无法正确识别输入文件。解决方法重命名视频文件:将文件名改为纯英文或数字(例如 video.mp4),移除 #、空格、中文等符号。移动文件:将视频放到浅层目录(如 D:\videos\),避免过长的路径。重新载入软件:在 pyVideoTrans 中重新选择该文件进行翻译。请查阅相关文档:错误中含有 ffp...140.237* Posted at: 6 days ago -
#4727 怎么克隆原视频有多个人说话的声音,克隆后该怎么使用...
💬 8[Last reply:7 days ago] 根据知识库,clone-voice 是一个独立的 TTS 配音渠道(对应渠道序号27),需要先启动 clone-voice 的服务(app.exe),然后在 pyVideoTrans 软件中进行相应配置才能使用。但知识库中并未详细说明如何在 pyVideoTrans 的菜单中找到该选项。最可能的原因是:你需要通过主界面的“配音渠道”下拉列表直接选择 clone-voice,而不是在菜单→TTS设置...104.248* Posted at: 7 days ago -
#4726 该角色不支持试听=system:Windows-10-10.0.26200-SP0version:v4.00frozen:Truelanguage:zhroot_dir:D:/aaa...
💬 1[Last reply:7 days ago] 这个问题通常是以下原因导致的:你选择了本地API配音渠道(如 F5-TTS、GPT-SoVITS、OmniVoice 等),但对应的API服务并未启动或不在运行,因此无法试听。请先确保本地API服务已正确运行并可在浏览器中访问(例如 http://127.0.0.1:7860)。你选择了 clone(克隆) 角色。clone角色需依赖原始视频中的音频作为参考,试听功能默认不支持。若使用的是 Edg...104.248* Posted at: 7 days ago -
#4725 requests.exceptions.ProxyError: HTTPSConnectionPool(host='translate.google.com', port=443): Max retries exceeded with url: /m?sl=en&tl=es&hl=es&q=Construction%20contractors%20and%2...
💬 1[Last reply:7 days ago] 这是由于主界面“网络代理”文本框填写了无效或未启动的代理地址导致的。软件通过该代理访问 Google 翻译,但代理服务未运行或地址/端口错误,因此连接被拒绝。解决方法:打开主界面,找到 网络代理 文本框,清空所有内容(保持空白)。如果仍需使用 Google 翻译,请确保已在本地运行正确的代理服务(如 Clash),并填入正确格式,例如 http://127.0.0.1:7890。若不确定如何配置代...222.247* Posted at: 7 days ago -
#4722 提取字幕成功后,卡在翻译阶段不动了...
💬 13[Last reply:7 days ago] 从日志看,腾讯翻译已成功完成第一行翻译(返回了“Hello, my friend”),但后续未继续输出翻译进度,说明翻译任务正在逐行执行但可能因以下原因卡住:主要原因:逐行翻译的间隔设置过大或网络延迟导致看起来不动请按以下步骤快速确认和修复:1. 检查并调整请求间隔进入 菜单 → 工具/选项 → 高级选项 → 字幕翻译调整,将 翻译后暂停秒 设为 0(或最小1秒),然后重新处理(需勾选主界面“清理...119.118* Posted at: 7 days ago -
#4723 openai.BadRequestError: Error code: 400 - {'error': {'message': 'level...
💬 1[Last reply:7 days ago] 错误原因是 AI 翻译渠道向 OpenAI 兼容接口发送请求时,传入了空字符串的 level 参数,但该接口只接受 low, medium, high, xhigh。这通常出现在使用 DeepSeek 等需要指定推理等级的模型时,而 pyVideoTrans 的翻译配置中可能未正确传递该参数或模型名称填写有误。解决方法:检查 AI 翻译渠道设置 打开顶部菜单 → 对应 AI 翻译渠道的设置(如 ...38.65* Posted at: 7 days ago -
#4721 FREE GPT API:Traceback (most recent call last): File "videotrans\translator\_base.py", line 72, in run File "videotran......
💬 1[Last reply:7 days ago] 翻译 API 返回了 HTML 页面而非有效 JSON,说明请求被拦截或配置错误。原因:你使用的翻译渠道(可能是 DeepSeek、OpenAI 兼容接口等)的 API 地址或密钥无效、服务不可用、或被代理/防火墙拦截,导致返回了第三方页面的内容("FREE GPT API")。解决:检查 API 地址和密钥:在菜单栏对应翻译渠道设置中,确认 Base URL 和 API Key 填写正确,确保 ...54.199* Posted at: 7 days ago -
#4720 我更换了3060ti显卡,如果用large-v3模型识别语音,CPU飙升100%,独显为0,感觉独显没有工作,cuda等驱动都安装好了...
💬 7[Last reply:7 days ago] ffmpeg 在命令行独立使用时是否能用显卡,取决于你指定的编码器(如 h264_nvenc 或 hevc_nvenc),但这不在 pyVideoTrans 软件的功能范围内。软件内置的 ffmpeg 转换(左侧工具栏的“音频视频格式转换”)及视频合成步骤,可通过取消 强制软编码视频? 选项来尝试调用 NVIDIA 硬件编码。建议操作: 直接使用软件自带的“格式转换”工具将 .webm 转为 ....2a14:4900* Posted at: 7 days ago -
#4717 有中文音轨和中英文字幕srt文件各一份,怎么克隆音色生成英文音轨...
💬 17[Last reply:7 days ago] 你确认选择了 clone,但日志中依然出现了 nverguo.wav 参考音频条目。这说明软件内仍残留了手动参考音频的配置,导致即使选择 clone,模型仍然尝试加载 nverguo.wav 作为参考,从而卡住。请按以下步骤彻底清除参考音频残留:1. 删除 f5-tts 文件夹中的 nverguo.wav:进入软件根目录下的 f5-tts/ 文件夹,删除 nverguo.wav 文件(如果存在)。...142.171* Posted at: 7 days ago -
#4719 原音色克隆不可试听=system:Windows-10-10.0.26200-SP0version:v4.00frozen:Truelanguage:zhroot_dir:D:/pyVideoTrans...
💬 1[Last reply:7 days ago] 原音色克隆(clone)角色本身没有预设的固定音色,它需要依赖具体视频中说话人的原始音频作为参考。软件在未加载并处理视频前,无法确定该视频中的具体音色,因此试听功能对clone角色不适用。这是正常设计,并非故障。如何验证克隆效果?导入一个包含清晰人声的视频,正确选择“发音语言”和“目标语言”,在主界面勾选clone角色,直接执行视频翻译流程。配音生成后可在最终视频中听到克隆音色。如需单独测试某一句...123.152* Posted at: 7 days ago -
#4716 requests.exceptions.ConnectTimeout: HTTPConnectionPool(host='127.0.0.0', port=9874): Max retries exceeded with url: /tts (Caused by ConnectTimeoutError(<urllib3.connection.HTTPConn...
💬 1[Last reply:7 days ago] 该错误是由于 TTS 配音服务连接地址错误导致的。日志显示软件正尝试向 http://127.0.0.0:9874/tts 发送请求,但 127.0.0.0 是一个无效的本地回环地址(正确应为 127.0.0.1 或实际部署的 IP),且该端口上的服务超时无响应。解决方法:检查配音渠道设置:进入菜单栏对应配音渠道的配置界面(如 GPT-SoVITS / F5-TTS / CosyVoice 等),...2409:8a30* Posted at: 7 days ago -
#4715 requests.exceptions.ConnectionError: HTTPConnectionPool(host='127.0.0.1', port=9880): Max retries exceeded with url: /tts (Caused by NewConnectionError('<urllib3.connection.HTTPCon...
💬 1[Last reply:7 days ago] 这是由于 pyVideoTrans 尝试连接本地的 GPT-SoVITS API 服务(http://127.0.0.1:9880)时失败,服务未启动或端口错误。解决方案:确保 GPT-SoVITS 服务已启动:请手动运行 GPT-SoVITS 工具,确认其 API 服务已成功启动并监听在 127.0.0.1:9880。如果使用了其他端口或地址,需在 pyVideoTrans 中对应修改。检查 A...2409:8a30* Posted at: 7 days ago -
#4714 TaskCfgVTT(uuid='0aca5a80c6', name='E:/-076-C.mp4', dirname='E:/', noextname='-076-C', basename='-076-C.mp4', ext='mp4', target_dir='E:/aaa/-076-C-mp4', cache_folder='E:/win-pyvide...
💬 1[Last reply:7 days ago] 这是由于显存不足(bad allocation)导致的。当前使用的是 large-v3 大模型并启用了 CUDA 加速,对显卡显存要求较高,当显存不够时 ONNX 后端会分配失败。解决办法:调小 ASR 模型:在主界面将语音识别模型从 large-v3 切换为 medium 或 small。优化显存占用:打开菜单 → 工具/选项 → 高级选项 → 语音识别参数:CUDA数据类型 设为 float1...2409:8a6a* Posted at: 7 days ago -
#4713 程序内部错误:module 'decoders' has no attribute 'DecodeStream'...
💬 1[Last reply:7 days ago] module 'decoders' has no attribute 'DecodeStream' 是 Whisper 相关模块(如 faster-whisper 或 openai-whisper)中的属性缺失错误,通常由 旧版次依赖不兼容 引起。您当前使用的是 v3.98 版本,建议升级到最新 v4.00 完整包,该错误已在后续版本修复。临时解决方案(可尝...2409:8a6a* Posted at: 7 days ago -
#4712 TaskCfgVTT(uuid='0aca5a80c6', name='E:/RBK-076-C.mp4', dirname='E:/', noextname='RBK-076-C', basename='RBK-076-C.mp4', ext='mp4', target_dir='E:/aaa/RBK-076-C-mp4', cache_folder='E...
💬 1[Last reply:7 days ago] 这是由于 tokenizers 库与 faster-whisper 的版本不兼容导致 decoders 模块缺少 DecodeStream 属性,常见于依赖冲突或打包不完整。解决方法:重新下载完整包:前往官网下载最新的 v4.00 完整 .7z 压缩包,解压到不含中文或空格的路径(如 D:\pyVideoTrans),然后替换当前软件目录。替换 sp.exe:如果已使用完整包,可单独下载最新 sp...2409:8a6a* Posted at: 7 days ago -
#4711 TaskCfgVTT(is_cuda=True, uuid='25a1536ea2', cache_folder='D:/project/Videotrans/raw-source/tmp/17932/25a1536ea2', target_dir='E:/1/_video_out/1 1. Introduction - What You Will Buil...
💬 1[Last reply:7 days ago] 这是由于您的显卡或CUDA环境不支持高效的float16计算类型。faster-whisper与ctranslate2在启用CUDA时默认尝试使用float16,但您的显卡(如10系列或老旧)或CUDA版本未满足要求。解决方案进入高级选项:在软件顶部菜单栏点击 工具/选项 → 高级选项 → 语音识别参数。修改CUDA数据类型:将 CUDA数据类型 从默认的 float16 改为 int8(兼容性最...18.142* Posted at: 7 days ago -
#4710 videotrans.configure._except.StopRetry: C:/Users/Administrator/ai/win-pyvideotrans-v3.99-428/f5-tts/laowai.wav 角色不存在...
💬 1[Last reply:7 days ago] 错误原因:F5-TTS 配音渠道未找到指定的参考音频角色。报错显示文件路径存在,但软件未能将其识别为可用角色,常见原因包括:参考音频文件名未包含后缀 .wav,或音频格式、时长不符合要求。解决方案检查文件命名确认软件主界面中,“配音角色”选项里填写的名称是否为 laowai.wav(必须包含 .wav 后缀)。检查 f5-tts/ 文件夹下是否存在该文件,文件名需完全一致(区分大小写)。验证音频文...2409:8a30* Posted at: 7 days ago -
#4708 我用官方下载的INDEXtts1.5 刚换的3060ti显卡,生成语音的时候很慢,我看了一下任务管理器gpu使用率为1%-11%,感觉现在用的是CPU生成的,...
💬 13[Last reply:8 days ago] 是的,按以下三步操作即可:1. 更新显卡驱动:到 NVIDIA 官网下载最新驱动(建议 572 系列及以上),重启电脑。2. 安装 CUDA 12.8 和 cuDNN 9.11: - 下载 CUDA 12.8 Toolkit:下载地址,安装后重启。 - 下载 cuDNN 9.11:安装教程,将解压后的文件夹内的 bin、lib、include 目录复制到 CUDA 12.8 安装目录下(默...2a14:4900* Posted at: 8 days ago
Open source and free maintenance is not easy. If this project is helpful to you, please consider making a small donation to help the project continue to maintain and update.