-
#3469 总是到声音克隆这一步就卡住了很慢...
💬 7[Last reply:3 months ago] 问题核心在于外部TTS服务(如F5-TTS/CosyVoice)本身未启用GPU加速或配置有误,导致声音克隆计算在CPU上进行,速度极慢。解决方案:确认外部TTS服务已启用GPU:检查你启动F5-TTS或CosyVoice等服务的命令行窗口,查看其启动日志中是否包含“CUDA”、“GPU”或“cuda”等字样,确认其是否成功加载了CUDA。如果没有,需要在其部署环境中正确配置CUDA。检查外部TT...43.162* Posted at: 3 months ago -
#3471 numpy.core._exceptions._ArrayMemoryError: Unable to allocate 1022. MiB for an array with shape (267894784,) and data type float32...
💬 1[Last reply:3 months ago] 这是由于内存不足导致无法加载音频数据。错误显示无法分配约 1GB 的内存给一个形状为 (267894784,) 的 float32 数组,这通常发生在处理大型音频文件时,且系统可用内存不足。解决方案:检查并关闭其他占用内存的程序:关闭不必要的浏览器标签页、大型软件(如 Photoshop、游戏等),释放系统内存。降低处理文件的规模:如果视频/音频文件非常大,尝试先将其分割成较小的片段进行处理。调整...113.12* Posted at: 3 months ago -
#3470 STT模式运行成功,vtv模式打印出参数列表后就没反应了...
💬 10[Last reply:3 months ago] 问题已解决。如果后续使用中遇到其他问题,可随时提供日志信息进行分析。...36.7* Posted at: 3 months ago -
#3468 配音合成阶段特别慢...
💬 1[Last reply:3 months ago] 配音合成阶段特别慢通常是由于未启用GPU加速或使用了性能较弱的TTS渠道。检查并启用GPU加速:确保已安装CUDA 12.8和cuDNN 9.x,并在“菜单-工具-高级选项-通用设置”中确认“GPU同时任务数”已设置为1或更高(需重启软件生效)。本地TTS模型(如Qwen-TTS、F5-TTS)无GPU加速会极慢。优化TTS渠道设置:如果使用Edge-TTS,请在“高级选项-字幕配音调整”中,将“...2408:8226* Posted at: 3 months ago -
#3467 TaskCfgSTT(is_cuda=True, uuid='a403c9e308', cache_folder='D:/win-pyvideotrans-v3.97-0304/tmp/6520/a403c9e308', target_dir='D:/win-pyvideotrans-v3.97-0304/output/recogn', source_lan...
💬 1[Last reply:3 months ago] 错误原因是您在使用 Windows 预打包版(.exe)软件时,选择了无法在该版本中运行的“Faster-Whisper-XXL.exe”语音识别渠道。根据知识库,Faster-Whisper-XXL.exe 是一个独立的命令行工具,无法集成在预打包版中。错误信息明确指出:“当前Faster-Whisper-XXL无法在打包版中使用,请源码部署或单独使用Faster-Whisper-XXL转录”。...27.210* Posted at: 3 months ago -
#3466 TaskCfgVTT(is_cuda=False, uuid='933949caa5', cache_folder='D:/install/win-pyvideotrans-v3.97-0303/tmp/21952/933949caa5', target_dir='D:/project/ai/mini/E2FGVI/examples/_video_out/4...
💬 1[Last reply:3 months ago] 这是由于连接 CosyVoice 本地服务超时导致的。错误日志显示 httpx.ReadTimeout: timed out,表明 pyVideoTrans 在尝试连接 CosyVoice 的 API 服务时,在规定时间内未收到响应。解决方案:确保 CosyVoice 服务已正确启动并运行:检查你部署 CosyVoice WebUI 的终端窗口是否仍在运行,且没有报错。验证 API 地址和端口:在...159.138* Posted at: 3 months ago -
#3465 The translated audio is faster than the original audio, so is there a function to automatically slow down the translated audio?...
💬 1[Last reply:3 months ago] 这是由于翻译后的配音语速过快导致的。pyVideoTrans 提供了自动对齐功能来调整配音速度,使其与视频画面同步。解决方案:在视频翻译主界面,找到“同步对齐”行。勾选“视频慢速”选项。该功能会放慢视频播放速度以等待较长的配音播完,从而解决配音过快的问题。如果希望强制调整配音速度,可以同时或单独勾选“配音加速”选项。该功能会加速配音以匹配原视频时长。对于更精细的控制,可以调整“配音语速”参数(例如...2001:ee0* Posted at: 3 months ago -
#3464 RuntimeError: File model.bin is incomplete: failed to read a buffer of size 884736 at position 62555244...
💬 1[Last reply:3 months ago] 这是由于 faster-whisper 模型文件下载不完整或已损坏导致的。解决方案:删除损坏的模型文件:前往软件根目录 D:\BaiduNetdiskDownload\win-pyvideotrans-v3.97-0303,进入 models 文件夹,找到并删除 models--Systran--faster-whisper-large-v3 文件夹(或你正在使用的其他模型文件夹,如 large-...113.70* Posted at: 3 months ago -
#3463 RuntimeError: WebSocket upgrade failed: Authentication error (401). Please check subscription information and region name. USP state: Sending. Received audio size: 0 bytes....
💬 1[Last reply:3 months ago] 这是由于 Azure TTS 的订阅密钥或区域名称配置错误导致的认证失败。检查 Azure TTS 配置:在软件主界面“配音渠道”中选择“AzureTTS”。点击“设置”按钮,确保“密钥”和“区域”填写正确。“密钥”必须是有效的 Azure 语音服务订阅密钥。“区域”必须与创建该密钥的 Azure 区域完全一致(例如 eastus)。验证 Azure 资源:登录 Azure 门户,确认你的语音服务...182.35* Posted at: 3 months ago -
#3462 Output #0, ipod, to 'origin_audio.m4a': Metadata: encoder : Lavf61.7.100 Stream #0:0: Audio: aac (LC) (mp4a / 0x6134706D), 48000 Hz, stereo, fltp, 128 kb/s Me...
💬 1[Last reply:3 months ago] 根据日志信息,这是视频/音频处理过程中 FFmpeg 转码输出的常规进度信息,并非错误。它显示了音频流(AAC编码)的转换过程,包括比特率、时长和速度。这表明软件正在正常工作,将原始音频提取或转换为中间格式。如果您遇到的问题是处理卡住、速度慢或最终失败,请检查以下几点:检查输出目录:确认 D:/win-pyvideotrans-v3.97-226/_video_out/ 目录下是否有最终生成的文件...60.248* Posted at: 3 months ago -
#3461 HTTPSConnectionPool(host='translate.google.com', port=443): Max retries exceeded with url: /m?sl=en&tl=zh-cn&hl=zh-cn&q=Now%20tell%20me,%20have%20you%20ever%20been%20too%20availabl...
💬 1[Last reply:3 months ago] 这是由于网络代理配置错误或无法连接导致的。Google翻译渠道需要访问 translate.google.com,但软件尝试通过配置的代理连接时失败,因为目标计算机(代理服务器)拒绝了连接。解决方案:检查并更正网络代理设置:在软件主界面,点击顶部菜单栏的“工具” -> “网络代理”,检查代理地址和端口是否正确。如果不需要代理,请清空代理地址和端口,然后点击“保存”。测试代理连通性:确认你的代...39.185* Posted at: 3 months ago -
#3459 TaskCfgVTT(is_cuda=True, uuid='a40554519c', cache_folder='H:/win-pyvideotrans-v3.97-0303/tmp/33940/a40554519c', target_dir='13-mp4', source_language='简体中文', source_language_code='z...
💬 4[Last reply:3 months ago] 是在同一块硬盘吗?是本地路径还是\\\\这类网络路径?有没有手动点击“输出...”按钮设置?看起来 target_dir 不太正常,应该是 盘符:/开头才对点击 菜单-工具-高级选项-通用设置-批量翻译时强制串行,选中它,然后保存,再批量试试还有米有报错...114.246* Posted at: 3 months ago -
#3460 =====system:Windows-10-10.0.19045-SP0version:v3.97frozen:Truelanguage:zhroot_dir:D:/Program Files/win-pyvideotrans-...
💬 1[Last reply:3 months ago] 您的软件信息显示:系统为 Windows 10,使用的是 v3.97 预打包版,安装路径为 D:/Program Files/win-pyvideotrans-v3.97。核心问题:您的安装路径位于 C:\Program Files 或 D:\Program Files 这类受系统保护的目录。根据知识库,这可能导致软件运行时因权限不足而出现各种无法预料的错误。解决方案:立即停止在当前目录下运行软件...183.219* Posted at: 3 months ago -
#3458 videotrans.configure._except.StopRetry: [WinError 10061] No connection could be made because the target machine actively refused it...
💬 1[Last reply:3 months ago] This error indicates that pyVideoTrans cannot connect to the F5-TTS API service. The target machine (likely 127.0.0.1:7860) actively refused the connection.Solution:Ensure the F5-TTS API service is ru...2402:800* Posted at: 3 months ago -
#3457 最新版本在翻译视频功能中间会卡在配音阶段不动。早上挂好后回来还是停在中间,非要自己按一下回车才行,会才动,然后就导致视频没有做完 电脑也开了一天,没有办法自动关机。...
💬 2[Last reply:3 months ago] 源码部署?如果是的话,有可能你最后鼠标点了黑窗口导致暂停,这是cmd终端窗口常有的问题如果是win预打包版,需要看具体哪个配音渠道,如果是类似f5tts配音渠道,自行部署的话,也可能和对应终端有关...240a:42a8* Posted at: 3 months ago -
#3456 pyimod03_ctypes.install.<locals>.PyInstallerImportError: Failed to load dynlib/dll 'D:\\win-pyvideotrans-v3.97-226\\_internal\\azure\\cognitiveservices\\speech\\Microsoft.Cognitive...
💬 1[Last reply:3 months ago] 这是由于操作系统缺少必要的VC++运行时组件,导致Azure TTS所需的动态链接库(DLL)无法加载。解决方案:请访问微软官方下载页面,安装最新的Visual C++ Redistributable for Visual Studio 2015-2022 (x64) 组件。直接下载链接:https://aka.ms/vs/17/release/vc_redist.x64.exe下载完成后,运行安...60.249* Posted at: 3 months ago -
#3455 TaskCfgSTT(is_cuda=True, uuid='59f00a83a7', cache_folder='E:/ytrans/tmp/4868/59f00a83a7', target_dir='E:/ytrans/output/recogn', source_language=None, source_language_code=None, sou...
💬 1[Last reply:3 months ago] This error is caused by insufficient GPU memory (VRAM) when using the faster-whisper model with CUDA acceleration.To resolve this, follow these steps:Reduce GPU memory usage:Go to Menu -> Tools/Opt...202.150* Posted at: 3 months ago -
#3454 新版本为什么不能选择源语言自动检测...
💬 2[Last reply:3 months ago] 在 “批量语音转字幕” 功能面板中可以选择“自动检测”,在“翻译视频或音频”功能中去掉了 自动检测,因视频翻译后续工作如字幕翻译、配音(涉及参考音频)等某些渠道需要明确指定原始语言,否则会报错,而且某些语音识别渠道并不返回检测到的语言代码,导致想中途更新也难以实现。因此综合考虑,在视频翻译中去掉了自动检测,请明确指定,如果你仅仅想转录语音为字幕,可单独使用左侧面板中的“批量语音转字幕”功能...2603:c024* Posted at: 3 months ago -
#3453 RuntimeError: File model.bin is incomplete: failed to read a buffer of size 13107200 at position 211504136...
💬 1[Last reply:3 months ago] 这是由于 faster-whisper 模型文件 model.bin 下载不完整或损坏导致的。解决方案:删除损坏的模型文件:前往软件安装目录 D:\BaiduNetdiskDownload\win-pyvideotrans-v3.97-0303\models,找到并删除与 faster-whisper 相关的模型文件夹(例如 models--Systran--faster-whisper-larg...82.38* Posted at: 3 months ago -
#3452 为什么第一次运行那么久...
💬 1[Last reply:3 months ago] 首次启动 pyVideoTrans 耗时较长,是因为软件需要初始化核心模块并加载必要的本地模型。具体原因和步骤:模块初始化:首次运行 sp.exe 时,软件需要加载并初始化所有功能模块(如语音识别、翻译、TTS等),这需要一定时间。模型加载:如果选择了本地语音识别模型(如 faster-whisper),软件会检查并准备模型文件,如果模型尚未下载,会触发下载过程,这可能导致启动时间显著延长。正常现...82.38* Posted at: 3 months ago
Open source and free maintenance is not easy. If this project is helpful to you, please consider making a small donation to help the project continue to maintain and update.
Dondate: ko-fi.com/jianchang512