-
#1666 我用的本地配音gpt-sovits 配音速度慢要调哪些参数可以加速配音...
💬 7[Last reply:3 months ago] 对于 32GB 显存的 RTX 5090 显卡,可以将“同时配音字幕数”设置为 8 到 12 之间,以最大化利用硬件性能。具体建议如下:1. 起始设置:建议从 8 开始。这是一个既能显著提升速度(相比默认值1),又留有充足显存余量的安全值。2. 激进设置:如果运行稳定,可以逐步提高到 10 或 12。32GB 显存完全有能力支持更高的并发数,这将使配音速度接近线性增长。3. 关键前提:在调整...60.7* Posted at: 6 months ago -
#3350 使用index-tts2配音速度太慢了...
💬 7[Last reply:3 months ago] 这是由于您当前在错误的目录下执行命令,且命令格式不完整导致的。解决方案:首先,找到您的Index-TTS2项目根目录。通常,如果您下载的是整合包,解压后的文件夹内应包含 api.py 文件。打开命令提示符(CMD)或 PowerShell,使用 cd 命令切换到该目录。例如:cd /d D:\Index-TTS2-windows-package然后,执行完整的启动命令。根据您的环境,选择以下两种方...2409:896a* Posted at: 3 months ago -
#3349 [WinError 2] 系统找不到指定的文件。: 'C:\\Users\\Administrator\\AppData\\Local\\Temp\\BNZ.699dbec18ad35e\\_internal\\ctranslate2'这是什么原因呢?...
💬 1[Last reply:3 months ago] 这是由于软件在临时目录中运行,导致无法找到必要的 ctranslate2 库文件。错误信息显示软件运行在 C:\Users\istrator\AppData\Local\Temp\BNZ.699dbec18ad35e 这个临时路径下,这通常是直接从压缩包内运行 .exe 文件造成的。解决方案:停止当前软件:关闭所有 pyVideoTrans 窗口。正确解压:将下载的 .7z 压缩包完整解...112.1* Posted at: 3 months ago -
#3348 为中英双语字幕上下位置添加设置选项...
💬 1[Last reply:3 months ago] 根据您的描述,这是一个关于在视频翻译输出时,调整双语字幕(例如中英双语)中两种语言字幕相对位置(上下)的功能建议。目前,pyVideoTrans 的核心知识库中未提及此功能的具体实现或配置选项。要实现类似 PotPlayer 中实时字幕翻译的“中文字幕在上/下”效果,您可以尝试以下方法:使用“双字幕”功能:在 pyVideoTrans 的视频翻译输出设置中,可以同时嵌入源语言字幕和目标语言字幕。但...203.10* Posted at: 3 months ago -
#3347 TaskCfg(cache_folder='D:/pyVideoTran/win-pyvideotrans-v3.96-24/tmp/36748/a74a8d3ed7', target_dir='D:/tkhub/downloads/测试/_video_out/douyin_阳光科普_7572841804799624128-mp4', remove_nois...
💬 1[Last reply:3 months ago] 这是由于 clone-voice 本地 TTS 模型与当前 CUDA 环境不兼容导致的。错误信息 no kernel image is available for execution on the device 表明 PyTorch/CUDA 版本与显卡计算架构不匹配。解决方案:检查并升级 CUDA 版本:clone-voice 等本地 TTS 模型通常需要与 PyTorch 版本匹配的 CUDA...138.2* Posted at: 3 months ago -
#3346 合并与输出阶段特别慢正常吗...
💬 1[Last reply:3 months ago] 合并与输出阶段特别慢是常见现象,主要原因通常是软件在后台进行高强度的音视频处理,特别是当视频较长、分辨率较高或使用了复杂的对齐策略时。核心原因与解决方案:硬件性能瓶颈:视频编码(尤其是H.264/H.265)是CPU密集型任务,如果CPU性能较弱,速度会显著变慢。建议:检查任务管理器,查看CPU占用率。这是正常处理过程,只能等待。确保电脑电源模式为“高性能”。对齐策略影响:如果开启了“视频慢速”或...2408:8226* Posted at: 3 months ago -
#3345 配音阶段出错 [clone-voice(本地)] {'code': 6, 'msg': 'CUDA error: no kernel image is available for execution on the device CUDA k......
💬 5[Last reply:3 months ago] 要解决 RTX 5060 Ti 显卡运行 clone-voice 的 CUDA 内核错误,核心是进入 clone-voice 项目的 Python 环境,安装一个支持新显卡架构的 PyTorch 版本。以下是具体步骤:定位并进入 clone-voice 环境:找到你安装 clone-voice 的目录。如果 clone-voice 使用 Conda 环境,通常目录下会有 environment.y...138.2* Posted at: 3 months ago -
#3344 为什么合成视频特别慢...
💬 1[Last reply:3 months ago] 视频合成速度慢通常是由于硬件性能不足或软件配置未优化导致的。主要原因及解决方案:未启用 GPU 加速:视频合成(尤其是配音加速/减速、音画对齐、编码)依赖 FFmpeg,默认使用 CPU 运算,速度很慢。检查:确保已安装 CUDA 12.8 和 cuDNN 9.11+。验证:在 CMD 中输入 nvcc -V 和 nvidia-smi 确认 CUDA 版本和显卡状态。配置:在软件“高级选项”中,确...2408:8226* Posted at: 3 months ago -
#3343 RuntimeError: {'message': 'tts failed', 'Exception': 'Could not load libtorchcodec. Likely causes:\n 1. FFmpeg is not properly installed in your environment. We support\n ...
💬 7[Last reply:3 months ago] 根据截图,服务器上已成功安装 FFmpeg 6.1.1 的共享库(libavutil.so.59 等文件已找到),但 TorchCodec 在加载时仍然失败。这表明问题可能更深层,涉及库文件版本冲突、依赖缺失或 TorchCodec 与当前 PyTorch/CUDA 环境不兼容。解决方案:检查 PyTorch 与 TorchCodec 版本兼容性:错误信息中已提示 PyTorch 版本 (2.10...2409:896a* Posted at: 3 months ago -
#3342 HTTPSConnectionPool(host='translate.google.com', port=443): Max retries exceeded with url: /m?sl=ja&tl=zh-cn&hl=zh-cn&q=%E3%81%8A%E7%96%B2%E3%82%8C%E6%A7%98%E3%81%A7%E3%81%99%E3%80...
💬 1[Last reply:3 months ago] 这是由于网络连接问题导致无法访问 Google 翻译服务。错误信息表明软件尝试连接 translate.google.com 时失败,可能因为网络环境限制(如需要代理)或 SSL 协议问题。解决方案:配置网络代理:如果您的网络环境需要代理才能访问 Google 服务,请在软件主界面右上角的“网络代理”设置中,填写可用的代理地址(例如 http://127.0.0.1:10809)。更换翻译渠道:G...43.206* Posted at: 3 months ago -
#3341 RuntimeError: {'message': 'tts failed', 'Exception': 'TorchCodec is required for load_with_torchcodec. Please install torchcodec to use this function.'}...
💬 3[Last reply:3 months ago] 这是由于 GPT-SoVITS 的 API 服务端缺少 torchcodec 依赖或版本不匹配导致的。GPT-SoVITS 服务端需要此库来处理音频编解码。解决方案:检查 GPT-SoVITS API 服务:确保你已正确部署并启动了 GPT-SoVITS 的 API 服务(通常是 http://127.0.0.1:9880 或 http://127.0.0.1:9881)。此错误通常源于服务端环境...2409:896a* Posted at: 3 months ago -
#3340 TaskCfg(cache_folder='D:/win-pyvideotrans-v3.97/tmp/22152/8e0a8641e1', target_dir='D:/Ken Tamplin Vocal Academy - How To Sing Better Than Anyone Else 2.0/Volume 1/_video_out/01. Vo...
💬 1[Last reply:3 months ago] 这是由于显卡的CUDA计算能力与faster-whisper模型编译的CUDA内核不匹配导致的。错误 cudaErrorNoKernelImageForDevice: no kernel image is available for execution on the device 表明你的NVIDIA显卡(可能是较新的50系显卡)无法运行当前版本的faster-whisper。解决方案:临时方案(...223.74* Posted at: 3 months ago -
#3337 ValueError: Could not get Gradio config from: http://localhost:8000/...
💬 13[Last reply:3 months ago] 这是由于 Index-TTS2 的 api_server.py 在导入时遇到了更深层的依赖问题,具体是 fairseq 库或其相关模块(这里指向了“text”)无法正确加载。这通常是由于环境依赖冲突或不完整导致的。解决方案:在 Index-TTS2 的云计算环境中,检查并确保安装了所有必需依赖。建议参考 Index-TTS2 项目的官方 README 或 requirements.txt 文件,使...2409:896a* Posted at: 3 months ago -
#3338 Error no file named pytorch_model.bin, model.safetensors, tf_model.h5, model.ckpt.index or flax_model.msgpack found in directory E:/AI/pyvideotrans/models/models--Qwen--Qwen3-TTS-1...
💬 1[Last reply:3 months ago] 这是由于 Qwen3-TTS 模型文件未正确下载或放置导致的。解决方案:确认模型目录:检查路径 E:/AI/pyvideotrans/models/models--Qwen--Qwen3-TTS-12Hz-1.7B-Base 是否存在。手动下载模型:由于 HuggingFace 在国内访问困难,需要手动下载模型文件。从镜像站或可靠来源下载 Qwen3-TTS-12Hz-1.7B-Base 的模型文...151.247* Posted at: 3 months ago -
#3336 使用云算力部署b站index-tts2后执行配音无反应...
💬 3[Last reply:3 months ago] 这是由于正式执行配音时,软件向 Index-TTS2 API 发送的请求格式或参数与试听测试时不同,导致服务端处理失败或返回了错误但未被日志捕获。根据您提供的截图,API 服务(http://127.0.0.1:8080)已成功启动并显示 Gradio 界面,证明服务本身是运行的。问题核心在于正式执行与试听测试的请求差异。请按以下步骤排查:检查 API 请求格式:正式执行时,软件可能发送了包含多句...2409:896a* Posted at: 3 months ago -
#3335 ValueError: Could not get Gradio config from: http://127.0.0.1:8000/...
💬 1[Last reply:4 months ago] 这是由于无法连接到本地部署的 F5-TTS 服务导致的。错误表明 pyVideoTrans 尝试从 http://127.0.0.1:8000/ 获取 Gradio 配置信息但失败了。解决方案:确认 F5-TTS 服务已正确启动:确保您已按照官方文档部署并启动了 F5-TTS 服务。服务启动后,应能在浏览器中通过 http://127.0.0.1:8000 访问其 Web 界面。检查服务地址和端口...2409:896a* Posted at: 4 months ago -
#3334 RuntimeError: Unable to open file 'model.bin' in model 'C:/PyVideoTrans/models/models--Systran--faster-whisper-large-v3'...
💬 1[Last reply:4 months ago] This error indicates that the faster-whisper model file model.bin is missing from the specified directory. This is typically caused by an incomplete or failed model download.Solution Steps:Check the m...2804:14c* Posted at: 4 months ago -
#3333 RuntimeError: Unable to open file 'model.bin' in model 'C:/Users/House Dev/Downloads/PyVideo/models/models--mobiuslabsgmbh--faster-whisper-large-v3-turbo'...
💬 1[Last reply:4 months ago] This error occurs because the faster-whisper model file (model.bin) is missing from the specified directory. The model download from HuggingFace likely failed or was incomplete.Solution Steps:Manually...2804:14c* Posted at: 4 months ago -
#3332 cannot import name 'GenerationMixin' from 'transformers.generation' (D:\pyvideotrans\_internal\transformers\generation\__init__.py)...
💬 3[Last reply:4 months ago] The repeated error indicates the downloaded package itself might be corrupted or your antivirus software is interfering with the extraction/execution of the _internal folder files.Solution Steps:Disab...162.211* Posted at: 4 months ago -
#3331 cannot import name 'GenerationMixin' from 'transformers.generation' (D:\pyvideotrans2\win-pyvideotrans-v3.97 (1)\_internal\transformers\generation\__init__.py)...
💬 1[Last reply:4 months ago] This error is caused by an incompatible version of the transformers library within the pre-packaged Windows version of pyVideoTrans.The error cannot import name 'GenerationMixin' indicates t...162.211* Posted at: 4 months ago
Open source and free maintenance is not easy. If this project is helpful to you, please consider making a small donation to help the project continue to maintain and update.
Dondate: ko-fi.com/jianchang512