-
#3346 合并与输出阶段特别慢正常吗...
💬 1[Last reply:19 days ago] 合并与输出阶段特别慢是常见现象,主要原因通常是软件在后台进行高强度的音视频处理,特别是当视频较长、分辨率较高或使用了复杂的对齐策略时。核心原因与解决方案:硬件性能瓶颈:视频编码(尤其是H.264/H.265)是CPU密集型任务,如果CPU性能较弱,速度会显著变慢。建议:检查任务管理器,查看CPU占用率。这是正常处理过程...2408:8226* Posted at: 19 days ago -
#3345 配音阶段出错 [clone-voice(本地)] {'code': 6, 'msg': 'CUDA error: no kernel image is available for execution on the device CUDA k...
💬 5[Last reply:19 days ago] 要解决 RTX 5060 Ti 显卡运行 clone-voice 的 CUDA 内核错误,核心是进入 clone-voice 项目的 Python 环境,安装一个支持新显卡架构的 PyTorch 版本。以下是具体步骤:定位并进入 clone-voice 环境:找到你安装 clone-voice 的目录。如果 clone...138.2* Posted at: 19 days ago -
#3344 为什么合成视频特别慢...
💬 1[Last reply:19 days ago] 视频合成速度慢通常是由于硬件性能不足或软件配置未优化导致的。主要原因及解决方案:未启用 GPU 加速:视频合成(尤其是配音加速/减速、音画对齐、编码)依赖 FFmpeg,默认使用 CPU 运算,速度很慢。检查:确保已安装 CUDA 12.8 和 cuDNN 9.11+。验证:在 CMD 中输入 nvcc -V 和 nv...2408:8226* Posted at: 19 days ago -
#3343 RuntimeError: {'message': 'tts failed', 'Exception': 'Could not load libtorchcodec. Likely causes:\n 1. FFmpeg ...
💬 7[Last reply:19 days ago] 根据截图,服务器上已成功安装 FFmpeg 6.1.1 的共享库(libavutil.so.59 等文件已找到),但 TorchCodec 在加载时仍然失败。这表明问题可能更深层,涉及库文件版本冲突、依赖缺失或 TorchCodec 与当前 PyTorch/CUDA 环境不兼容。解决方案:检查 PyTorch 与 To...2409:896a* Posted at: 19 days ago -
#3342 HTTPSConnectionPool(host='translate.google.com', port=443): Max retries exceeded with url: /m?sl=ja&tl=zh-cn&hl=zh-cn&q=...
💬 1[Last reply:19 days ago] 这是由于网络连接问题导致无法访问 Google 翻译服务。错误信息表明软件尝试连接 translate.google.com 时失败,可能因为网络环境限制(如需要代理)或 SSL 协议问题。解决方案:配置网络代理:如果您的网络环境需要代理才能访问 Google 服务,请在软件主界面右上角的“网络代理”设置中,填写可用的...43.206* Posted at: 19 days ago -
#3341 RuntimeError: {'message': 'tts failed', 'Exception': 'TorchCodec is required for load_with_torchcodec. Please install to...
💬 3[Last reply:19 days ago] 这是由于 GPT-SoVITS 的 API 服务端缺少 torchcodec 依赖或版本不匹配导致的。GPT-SoVITS 服务端需要此库来处理音频编解码。解决方案:检查 GPT-SoVITS API 服务:确保你已正确部署并启动了 GPT-SoVITS 的 API 服务(通常是 http://127.0.0.1:98...2409:896a* Posted at: 19 days ago -
#3340 TaskCfg(cache_folder='D:/win-pyvideotrans-v3.97/tmp/22152/8e0a8641e1', target_dir='D:/Ken Tamplin Vocal Academy - How To...
💬 1[Last reply:19 days ago] 这是由于显卡的CUDA计算能力与faster-whisper模型编译的CUDA内核不匹配导致的。错误 cudaErrorNoKernelImageForDevice: no kernel image is available for execution on the device 表明你的NVIDIA显卡(可能是较新的...223.74* Posted at: 19 days ago -
#3337 ValueError: Could not get Gradio config from: http://localhost:8000/...
💬 13[Last reply:19 days ago] 这是由于 Index-TTS2 的 api_server.py 在导入时遇到了更深层的依赖问题,具体是 fairseq 库或其相关模块(这里指向了“text”)无法正确加载。这通常是由于环境依赖冲突或不完整导致的。解决方案:在 Index-TTS2 的云计算环境中,检查并确保安装了所有必需依赖。建议参考 Index-T...2409:896a* Posted at: 19 days ago -
#3338 Error no file named pytorch_model.bin, model.safetensors, tf_model.h5, model.ckpt.index or flax_model.msgpack found in d...
💬 1[Last reply:19 days ago] 这是由于 Qwen3-TTS 模型文件未正确下载或放置导致的。解决方案:确认模型目录:检查路径 E:/AI/pyvideotrans/models/models--Qwen--Qwen3-TTS-12Hz-1.7B-Base 是否存在。手动下载模型:由于 HuggingFace 在国内访问困难,需要手动下载模型文件。从...151.247* Posted at: 19 days ago -
#3336 使用云算力部署b站index-tts2后执行配音无反应...
💬 3[Last reply:19 days ago] 这是由于正式执行配音时,软件向 Index-TTS2 API 发送的请求格式或参数与试听测试时不同,导致服务端处理失败或返回了错误但未被日志捕获。根据您提供的截图,API 服务(http://127.0.0.1:8080)已成功启动并显示 Gradio 界面,证明服务本身是运行的。问题核心在于正式执行与试听测试的请求差...2409:896a* Posted at: 19 days ago -
#3335 ValueError: Could not get Gradio config from: http://127.0.0.1:8000/...
💬 1[Last reply:19 days ago] 这是由于无法连接到本地部署的 F5-TTS 服务导致的。错误表明 pyVideoTrans 尝试从 http://127.0.0.1:8000/ 获取 Gradio 配置信息但失败了。解决方案:确认 F5-TTS 服务已正确启动:确保您已按照官方文档部署并启动了 F5-TTS 服务。服务启动后,应能在浏览器中通过 ht...2409:896a* Posted at: 19 days ago -
#3334 RuntimeError: Unable to open file 'model.bin' in model 'C:/PyVideoTrans/models/models--Systran--faster-whisper-large-v3'...
💬 1[Last reply:19 days ago] This error indicates that the faster-whisper model file model.bin is missing from the specified directory. This is typically caused by an incomplete or failed m...2804:14c* Posted at: 19 days ago -
#3333 RuntimeError: Unable to open file 'model.bin' in model 'C:/Users/House Dev/Downloads/PyVideo/models/models--mobiuslabsgm...
💬 1[Last reply:19 days ago] This error occurs because the faster-whisper model file (model.bin) is missing from the specified directory. The model download from HuggingFace likely failed o...2804:14c* Posted at: 19 days ago -
#3332 cannot import name 'GenerationMixin' from 'transformers.generation' (D:\pyvideotrans\_internal\transformers\generation\_...
💬 3[Last reply:19 days ago] The repeated error indicates the downloaded package itself might be corrupted or your antivirus software is interfering with the extraction/execution of the _in...162.211* Posted at: 19 days ago -
#3331 cannot import name 'GenerationMixin' from 'transformers.generation' (D:\pyvideotrans2\win-pyvideotrans-v3.97 (1)\_intern...
💬 1[Last reply:19 days ago] This error is caused by an incompatible version of the transformers library within the pre-packaged Windows version of pyVideoTrans.The error cannot import name...162.211* Posted at: 19 days ago -
#3330 cannot import name 'GenerationMixin' from 'transformers.generation' (D:\pyvideotrans\win-pyvideotrans-v3.97\_internal\tr...
💬 1[Last reply:19 days ago] This error is caused by an incompatible version of the transformers library bundled within the pre-packaged Windows version of pyVideoTrans.Solution:Download th...162.211* Posted at: 19 days ago -
#3329 TaskCfg(cache_folder='D:/pif/green/win-videotrans-v3.97-LiXianZiMu-ai/tmp/7516/ce3205b571', target_dir='D:/pif/green/win...
💬 1[Last reply:19 days ago] 这是由于软件打包环境中的 pytz 模块版本或依赖不完整导致的。pytz 是 pandas 和 modelscope 等库的依赖项,用于处理时区信息。在预打包的 Windows 版本中,该模块可能缺失了必要的子模块 tzinfo。解决方案:临时方案:切换到其他语音识别渠道。在“语音识别渠道”下拉菜单中,选择其他可用的渠...2409:8a4c* Posted at: 19 days ago -
#3328 opening output D:/pyvideotrans/tmp/6164/1771861344.00365-863a7732b4e.zh-Hans.mp3: No such file or directory opening outp...
💬 1[Last reply:19 days ago] 这是由于软件版本过旧(v3.92)导致的临时文件路径处理问题。解决方案:升级软件:这是最直接的解决方案。请下载最新版本 v3.97 的完整包,替换现有程序文件。下载地址:免费下载pyVideoTrans视频翻译软件清理缓存:在升级后,启动软件,点击主界面右上角的“设置”图标,进入“高级设置”,找到并点击“清理缓存”按钮...27.189* Posted at: 19 days ago -
#3327 TaskCfg(cache_folder='D:/win-pyvideotrans-v3.97/tmp/2076/47bbb1cd19', target_dir='E:/DownLoads/DCL/_video_out/Breeding M...
💬 1[Last reply:19 days ago] 这是由于使用 openai-whisper (本地) 模型进行语音识别时,模型推理过程中产生了 NaN(非数值)张量,导致解码失败。这通常与模型文件损坏、显存问题或特定视频/音频内容有关。解决方案:切换语音识别渠道:在“语音识别渠道”中,将 openai-whisper(本地) 暂时更换为 faster-whisper...240e:44d* Posted at: 19 days ago -
#3326 How to keep the original voice in the video?...
💬 1[Last reply:20 days ago] 要保留视频中的原声,需要在配音设置中禁用配音功能。在软件主界面,点击“配音设置”按钮。在配音设置窗口中,将“配音渠道”选择为“No”(即不配音)。确认设置后,执行翻译任务。软件将仅翻译字幕,而不会生成新的配音音频,最终输出的视频将保留原始音轨。请查阅相关文档:如何使用原视频中音色配音 (此文档主要介绍声音克隆,但其中也...2001:ee0* Posted at: 20 days ago
Open source and free maintenance is not easy. If this project is helpful to you, please consider making a small donation to help the project continue to maintain and update.