-
#3488 声音克隆到一般卡住不动了...
💬 7[Last reply:2 months ago] 要同时克隆一段视频中不同角色的音色,核心是结合“说话人分离”与“多角色配音”功能。解决方案:配置说话人分离:在软件顶部菜单栏,点击 工具/选项 - 高级选项。在 语音识别参数 区域,找到 说话人分离模型。选择一个模型(例如:内置模型、pyannote 或 CAM++)。如果选择 pyannote,需要在 Huggingface的token 处填写你的有效Token。设置 预计说话人数(可选,但建议...185.36* Posted at: 2 months ago -
#3487 OSError: cannot load library '/Users/yuejialei/pyvideotrans/.venv/lib/python3.10/site-packages/_soundfile_data/libsndfile.dylib': dlopen(/Users/yuejialei/pyvideotrans/.venv/lib/pyt...
💬 1[Last reply:2 months ago] 这是由于 macOS 系统缺少 libsndfile 音频库依赖导致的。安装 libsndfile:在终端中执行以下命令,使用 Homebrew 包管理器安装缺失的库。brew install libsndfile重新启动软件:安装完成后,关闭 pyVideoTrans 并重新启动 sp.py。请查阅相关文档:MacOS源码部署视频翻译软件...111.52* Posted at: 2 months ago -
#3486 OSError: cannot load library '/Users/yuejialei/pyvideotrans/pyvideotrans/.venv/lib/python3.10/site-packages/_soundfile_data/libsndfile.dylib': dlopen(/Users/yuejialei/pyvideotrans/...
💬 1[Last reply:2 months ago] 这是由于 macOS 系统缺少 libsndfile 音频库依赖导致的。解决方案:打开终端。使用 Homebrew 包管理器安装 libsndfile。如果尚未安装 Homebrew,请先访问 brew.sh 进行安装。在终端中执行以下命令:brew install libsndfile安装完成后,重启 pyVideoTrans 软件。请查阅相关文档:MacOS源码部署视频翻译软件...111.52* Posted at: 2 months ago -
#3485 本地模型qwen3,hy mt1.5 都显示连接错误,qwen2.5,deepseek r1无事,应该怎幺修改...
💬 1[Last reply:2 months ago] 这是由于 Ollama 中不同模型的 API 兼容性或模型名称格式问题导致的。解决方案:检查 Ollama 服务状态:确保 Ollama 服务正在运行。在命令行输入 ollama list,确认 qwen2.5:latest 和 deepseek-r1:latest 等能正常工作的模型已列出。验证模型名称:在 pyVideoTrans 的翻译渠道配置中,模型 字段必须填写 Ollama 中该模型的...182.123* Posted at: 2 months ago -
#3484 TaskCfg(cache_folder='D:/SOS/win-pyvideotrans-v3.92/tmp/4240/cd51eac79a', target_dir='F:/沙漏/NGOD-282', remove_noise=False, is_separate=False, detect_language=None, subtitle_languag...
💬 1[Last reply:2 months ago] 该错误是由于在音画对齐阶段,尝试加载一个不存在的音频文件(NoneType)导致的。具体发生在 _concat_audio 函数中,pydub 库无法从文件路径读取到有效的音频数据。解决方案:升级软件版本:您当前使用的是 v3.92。根据知识库第6.6节,v3.97 版本已修复了许多类似问题。请首先尝试升级到最新版本 v3.97。检查配音文件:在升级后,重新运行任务。如果问题依旧,请检查任务配置中...27.151* Posted at: 2 months ago -
#3483 TaskCfgSTT(is_cuda=True, uuid='c3fa5d2da7', cache_folder='E:/win-videotrans-v3.92/tmp/29376/c3fa5d2da7', target_dir='c:/users/user/videos/pyvideotrans/recogn', source_language=None...
💬 1[Last reply:2 months ago] 这是由于 llvmlite 库版本不兼容或损坏导致的,通常发生在使用预打包版(.exe)时,openai-whisper(本地) 语音识别渠道依赖的 numba 和 llvmlite 库与当前系统环境冲突。解决方案:切换语音识别渠道:这是最直接的解决方法。在“语音识别”行,将渠道从 openai-whisper(本地) 切换为 faster-whisper(本地)。faster-whisper 是...219.71* Posted at: 2 months ago -
#3481 OSError: cannot load library '/Users/junyouchen/Desktop/pyvideotrans/pyvideotrans/.venv/lib/python3.10/site-packages/_soundfile_data/libsndfile.dylib': dlopen(/Users/junyouchen/Des...
💬 1[Last reply:2 months ago] This error is caused by a missing system audio library (libsndfile) required by the soundfile Python package on macOS.Solution:Install the libsndfile library using Homebrew. Open your terminal and run...223.160* Posted at: 2 months ago -
#3480 HTTPSConnectionPool(host='dashscope.aliyuncs.com', port=443): Max retries exceeded with url: /api/v1/services/aigc/multimodal-generation/generation (Caused by SSLError(SSLEOFError(...
💬 1[Last reply:2 months ago] 这是由于网络连接问题或SSL证书验证失败导致的,具体表现为与阿里云DashScope服务的HTTPS连接中断。解决方案:检查网络连接:确保你的网络可以正常访问阿里云服务(dashscope.aliyuncs.com)。如果使用了代理,请在软件中正确配置网络代理。关闭SSL验证(临时方案):如果网络环境复杂(如公司内网),可以尝试在软件根目录下找到 videotrans/configure/conf...2602:fbf1* Posted at: 2 months ago -
#3479 Error code: 500 - {'error': {'message': 'Internal Server Error', 'type': 'internal_error', 'param': None, 'code': 'internal_error'}}...
💬 1[Last reply:2 months ago] 这是由于 OpenAI 兼容接口的服务器端出现了内部错误(Internal Server Error)导致的。检查 API 服务状态:确认你使用的 API 服务(如 DeepSeek、OpenAI 等)是否正常运行。可以尝试访问其官方状态页面或控制台。验证配置:在软件中检查“翻译渠道”或“语音识别渠道”的配置:API URL:确保地址正确(例如 DeepSeek 应为 https://api.de...2408:8234* Posted at: 2 months ago -
#3473 翻译视频或音频中怎样选择qwen3的base 和clone模型,在哪里选,我要保持音色与原视频一致是需要选clone模型吗?为什么下载qwen3需要这么久,几十分钟进度条都不到1%...
💬 3[Last reply:2 months ago] 此错误是由于在运行 Qwen-TTS 本地模型时,系统内存或显存不足,导致工作进程被强制终止。解决方案:降低资源占用:进入 菜单 -> 工具 -> 高级选项。在 【通用设置】 区域,将 GPU同时任务数[重启生效] 设置为 1。在 【字幕配音调整】 区域,将 并发配音线程数 设置为 1。修改后,关闭并重启软件 以使设置生效。检查并优化 Qwen-TTS 模型使用:确保你使用的是适合你硬...205.198* Posted at: 2 months ago -
#3476 tencentcloud.common.exception.tencent_cloud_sdk_exception.TencentCloudSDKException: [TencentCloudSDKException] code:FailedOperation.UserNotRegistered message:Service has not been o...
💬 1[Last reply:2 months ago] 这是由于腾讯云机器翻译服务未开通导致的。错误信息明确指出“Service has not been opened, please open service at Tencent Cloud console”。解决方案:登录腾讯云控制台:访问 腾讯云官网 并登录。开通机器翻译服务:在控制台搜索“机器翻译”或“TMT”。进入“机器翻译”产品页面。点击“立即使用”或“开通服务”。(部分服务可能需要实名认...39.189* Posted at: 2 months ago -
#3475 openai.PermissionDeniedError: Your request was blocked....
💬 5[Last reply:2 months ago] 根据日志分析,问题核心是 AI翻译渠道(OpenAI/兼容接口)的请求被服务商(很可能是DeepSeek)的接口风控策略阻止。日志显示请求已成功发送([DEBUG] [chatGPT]发送请求数据),但随后立即报错“Your request was blocked.”。由于你的API Key在其他客户端正常,这表明pyVideoTrans的请求模式(如并发、频率、请求体格式)触发了服务商的安全限制...2a02:6ea0* Posted at: 2 months ago -
#3474 CUDA out of memory. Tried to allocate 594.00 MiB. GPU 0 has a total capacity of 22.00 GiB of which 16.63 GiB is free. Of the allocated memory 3.55 GiB is allocated by PyTorch, and ...
💬 1[Last reply:2 months ago] 这是由于显存分配策略导致的显存碎片化问题,虽然总显存(22 GiB)有16.63 GiB空闲,但PyTorch无法分配连续的594 MiB内存。解决方案:设置环境变量:在启动pyVideoTrans之前,设置环境变量 PYTORCH_CUDA_ALLOC_CONF=expandable_segments:True。Windows预打包版用户:右键点击 sp.exe,选择“发送到” -> “桌...240e:3b1* Posted at: 2 months ago -
#3472 Could not parse response content as the length limit was reached - CompletionUsage(completion_tokens=4096, prompt_tokens=1375, total_tokens=5471, completion_tokens_details=None, pr...
💬 1[Last reply:2 months ago] 该错误是由于AI翻译渠道(如DeepSeek、OpenAI等)返回的响应内容过长,超出了其API的Token限制(通常是4096个Completion Token)导致的。解决方案:降低每次发送的字幕行数:这是最直接的解决方法。进入 菜单 -> 工具 -> 高级选项 -> 字幕翻译调整,将 AI翻译渠道每批字幕行数 从默认值(如100)降低到一个较小的值,例如 20 或 10。检...223.73* Posted at: 2 months ago -
#3469 总是到声音克隆这一步就卡住了很慢...
💬 7[Last reply:2 months ago] 问题核心在于外部TTS服务(如F5-TTS/CosyVoice)本身未启用GPU加速或配置有误,导致声音克隆计算在CPU上进行,速度极慢。解决方案:确认外部TTS服务已启用GPU:检查你启动F5-TTS或CosyVoice等服务的命令行窗口,查看其启动日志中是否包含“CUDA”、“GPU”或“cuda”等字样,确认其是否成功加载了CUDA。如果没有,需要在其部署环境中正确配置CUDA。检查外部TT...43.162* Posted at: 2 months ago -
#3471 numpy.core._exceptions._ArrayMemoryError: Unable to allocate 1022. MiB for an array with shape (267894784,) and data type float32...
💬 1[Last reply:2 months ago] 这是由于内存不足导致无法加载音频数据。错误显示无法分配约 1GB 的内存给一个形状为 (267894784,) 的 float32 数组,这通常发生在处理大型音频文件时,且系统可用内存不足。解决方案:检查并关闭其他占用内存的程序:关闭不必要的浏览器标签页、大型软件(如 Photoshop、游戏等),释放系统内存。降低处理文件的规模:如果视频/音频文件非常大,尝试先将其分割成较小的片段进行处理。调整...113.12* Posted at: 2 months ago -
#3470 STT模式运行成功,vtv模式打印出参数列表后就没反应了...
💬 10[Last reply:2 months ago] 问题已解决。如果后续使用中遇到其他问题,可随时提供日志信息进行分析。...36.7* Posted at: 2 months ago -
#3468 配音合成阶段特别慢...
💬 1[Last reply:2 months ago] 配音合成阶段特别慢通常是由于未启用GPU加速或使用了性能较弱的TTS渠道。检查并启用GPU加速:确保已安装CUDA 12.8和cuDNN 9.x,并在“菜单-工具-高级选项-通用设置”中确认“GPU同时任务数”已设置为1或更高(需重启软件生效)。本地TTS模型(如Qwen-TTS、F5-TTS)无GPU加速会极慢。优化TTS渠道设置:如果使用Edge-TTS,请在“高级选项-字幕配音调整”中,将“...2408:8226* Posted at: 2 months ago -
#3467 TaskCfgSTT(is_cuda=True, uuid='a403c9e308', cache_folder='D:/win-pyvideotrans-v3.97-0304/tmp/6520/a403c9e308', target_dir='D:/win-pyvideotrans-v3.97-0304/output/recogn', source_lan...
💬 1[Last reply:2 months ago] 错误原因是您在使用 Windows 预打包版(.exe)软件时,选择了无法在该版本中运行的“Faster-Whisper-XXL.exe”语音识别渠道。根据知识库,Faster-Whisper-XXL.exe 是一个独立的命令行工具,无法集成在预打包版中。错误信息明确指出:“当前Faster-Whisper-XXL无法在打包版中使用,请源码部署或单独使用Faster-Whisper-XXL转录”。...27.210* Posted at: 2 months ago -
#3466 TaskCfgVTT(is_cuda=False, uuid='933949caa5', cache_folder='D:/install/win-pyvideotrans-v3.97-0303/tmp/21952/933949caa5', target_dir='D:/project/ai/mini/E2FGVI/examples/_video_out/4...
💬 1[Last reply:2 months ago] 这是由于连接 CosyVoice 本地服务超时导致的。错误日志显示 httpx.ReadTimeout: timed out,表明 pyVideoTrans 在尝试连接 CosyVoice 的 API 服务时,在规定时间内未收到响应。解决方案:确保 CosyVoice 服务已正确启动并运行:检查你部署 CosyVoice WebUI 的终端窗口是否仍在运行,且没有报错。验证 API 地址和端口:在...159.138* Posted at: 2 months ago
Open source and free maintenance is not easy. If this project is helpful to you, please consider making a small donation to help the project continue to maintain and update.