-
#3534 RuntimeError: Argument #4: Padding size should be less than the corresponding input dimension, but got: padding (2, 2) a...
💬 1[Last reply:29 minutes ago] 该错误是由于使用 Qwen-TTS(本地) 进行声音克隆时,参考音频片段过短(或无效)导致模型无法提取有效的说话人嵌入特征。解决方案:确保参考音频长度合适:声音克隆需要 3-10 秒的清晰人声作为参考音频。请检查语音识别阶段生成的字幕片段时长。调整语音识别参数:打开 菜单 -> 工具 -> 高级选项。在 【...120.229* Posted at: 30 minutes ago -
#3533 TaskCfgVTT(is_cuda=False, uuid='342bdc5d2a', cache_folder='D:/数字媒体/win-pyvideotrans-v3.97-0304/tmp/5424/342bdc5d2a', tar...
💬 1[Last reply:1 hour ago] 这是由于 faster-whisper(本地) 语音识别模型文件 model.bin 下载不完整或已损坏导致的。解决方案:手动下载并替换模型文件:根据你使用的模型 large-v3,在软件根目录下的 models 文件夹内,创建名为 models--Systran--faster-whisper-large-v3 的文...2409:895a* Posted at: 1 hour ago -
#3532 pyimod03_ctypes.install.<locals>.PyInstallerImportError: Failed to load dynlib/dll 'D:\\11\\_internal\\azure\\cognitives...
💬 1[Last reply:2 hours ago] 这是由于操作系统缺少必要的 VC++ 运行库,导致 Azure TTS 依赖的 DLL 文件无法加载。解决方案:下载并安装微软 VC++ 可再发行组件包。请访问以下链接下载并运行安装程序:微软VC++组件下载地址安装完成后,重启计算机。重新启动 pyVideoTrans 软件。如果问题仍然存在,请检查您下载的软件包是否...104.249* Posted at: 2 hours ago -
#3531 RuntimeError: File model.bin is incomplete: failed to read a buffer of size 13107200 at position 446498790...
💬 1[Last reply:2 hours ago] 这是由于 faster-whisper 模型文件 model.bin 下载不完整或已损坏导致的。解决方案:手动下载并替换模型文件:前往 HuggingFace 模型页面:https://huggingface.co/Systran/faster-whisper-large-v3/tree/main将该页面上的所有 .j...2408:8221* Posted at: 2 hours ago -
#3530 怎么设置没人讲话时不显示字幕,而不是那个字幕从头到尾一直挂着...
💬 1[Last reply:4 hours ago] 要实现“没人讲话时不显示字幕”,即字幕仅在说话时出现,需要确保字幕文件的时间轴与语音片段精确对齐。这主要取决于语音识别(ASR)步骤的准确性。核心原因:字幕时间轴不精确,导致静音部分也显示了字幕。解决方案:优化语音识别参数:在软件主界面,点击“设置更多参数...”。在“语音识别参数”区域,调整以下关键设置:语音阈值:适...120.236* Posted at: 4 hours ago -
#3529 字幕识别完就自动下载,字幕栏清空了,没有记录...
💬 1[Last reply:6 hours ago] 这是由于软件在语音识别完成后自动进入了翻译阶段,但翻译渠道配置可能存在问题(如未配置API Key或网络连接失败),导致翻译失败并清空了字幕栏。请按以下步骤排查:检查翻译渠道配置:确认你选择的翻译渠道(如 OpenAI、DeepSeek、Google 等)已正确配置。如果是需要 API Key 的渠道(如 OpenAI...38.90* Posted at: 6 hours ago -
#3528 画质砍半了啊怎么设置保留原画质啊...
💬 1[Last reply:8 hours ago] 视频输出画质下降通常是由于视频编码参数设置不当导致的。核心原因是软件默认的“视频输出质量控制”和“输出视频压缩率”参数为了平衡文件大小和速度,可能降低了画质。解决方案:打开软件,点击顶部菜单栏的“工具/选项” -> “高级选项”。在“视频输出控制”区域,找到以下两个参数进行调整:视频输出质量控制:将此值调低以提高...2409:8a50* Posted at: 8 hours ago -
#3527 未获取到角色列表=system:Windows-10-10.0.19045-SP0version:v3.97frozen:Truelanguage:zhroot_dir:C:/Users/Administrator/AppData/Loca...
💬 1[Last reply:8 hours ago] 这是由于 Edge-TTS 渠道在获取可用配音角色列表时网络连接失败导致的。解决方案:检查网络连接:确保你的计算机可以正常访问互联网,特别是能够连接到微软的 Edge-TTS 服务。调整高级设置:在软件顶部菜单栏,点击 工具/选项 -> 高级选项,在“字幕配音调整”区域,将 EdgeTTS配音渠道配音并发数 设为...188.253* Posted at: 8 hours ago -
#3526 RuntimeError: cuBLAS failed with status CUBLAS_STATUS_NOT_INITIALIZED...
💬 1[Last reply:16 hours ago] 这是由于 CUDA 环境未正确初始化导致 cuBLAS 库调用失败。通常发生在 NVIDIA 显卡驱动、CUDA 或 cuDNN 版本不匹配或未正确安装时。解决方案:验证 CUDA 安装:打开命令提示符 (CMD),输入 nvcc -V 查看 CUDA 版本。pyVideoTrans 内置支持 CUDA 12.8。输入...144.48* Posted at: 16 hours ago -
#3525 RuntimeError: File model.bin is incomplete: failed to read a buffer of size 3276800 at position 500134913...
💬 1[Last reply:16 hours ago] 该错误是由于 faster-whisper 语音识别模型文件 model.bin 下载不完整或已损坏导致的。解决方案:手动下载并替换模型文件:根据你使用的模型(例如 large-v3),在软件根目录的 models 文件夹内,找到对应的模型文件夹(例如 models--Systran--faster-whisper-l...144.48* Posted at: 16 hours ago -
#3524 HTTPSConnectionPool(host='translate.google.com', port=443): Max retries exceeded with url: /m?sl=zh-cn&tl=en&hl=en&q=%E4...
💬 1[Last reply:19 hours ago] 这是由于网络代理配置错误或无法连接导致的。错误信息表明软件尝试通过代理访问 Google 翻译时,代理服务器(目标计算机)拒绝了连接。解决方案:检查代理设置:在软件主界面的“网络代理”输入框中,确认你填写的代理地址和端口是否正确且有效。格式应为 http://代理IP:端口 或 socks5://代理IP:端口。测试代...154.3* Posted at: 19 hours ago -
#3522 文件或数据解码失败,编码格式错误:invalid start byte...
💬 7[Last reply:20 hours ago] 这是由于网络限制导致无法访问 HuggingFace 官网。核心解决方案是使用国内镜像站下载模型文件,或通过配置网络代理让软件自动下载。解决方案:使用国内镜像站手动下载:访问 HuggingFace 国内镜像站:https://hf-mirror.com/mobiuslabsgmbh/faster-whisper-la...2409:8a55* Posted at: 1 day ago -
#3523 TaskCfgVTT(is_cuda=True, uuid='55d7490ad5', cache_folder='D:/videotrans/tmp/5612/55d7490ad5', target_dir='/dengking/nsfs...
💬 1[Last reply:21 hours ago] 这是由于 HuggingFace_ASR 语音识别渠道依赖的 transformers 库版本与 tokenizers 库版本不兼容导致的。错误信息显示需要 tokenizers>=0.22.0,<=0.23.0,但当前环境中的版本是 tokenizers==0.20.1。解决方案:更新依赖库:由于您使用的...208.87* Posted at: 21 hours ago -
#3521 HTTPSConnectionPool(host='translate.google.com', port=443): Max retries exceeded with url: /m?sl=yue&tl=en&hl=en&q=%E5%A...
💬 1[Last reply:1 day ago] 这是由于网络代理配置问题,导致软件无法连接到 Google 翻译服务。根据错误信息 HTTPSConnectionPool(host='translate.google.com', port=443): Max retries exceeded 和 Failed to establish a new...2409:8a28* Posted at: 1 day ago -
#3520 生成的字幕怎么修改大小位置样式啊...
💬 1[Last reply:1 day ago] 字幕的字体、大小、位置和样式可以在软件的高级选项中进行设置。打开 pyVideoTrans 软件。点击顶部菜单栏的 “工具/选项” -> “高级选项”。在打开的“高级选项”窗口中,找到并点击 “字幕字体设置” 选项卡。在此选项卡中,您可以分别设置:字体:选择字幕的字体。大小:调整字幕的字体大小。位置:通过调整“垂...120.227* Posted at: 1 day ago -
#3519 算术错误:数值超出最大限制:sleep length is too large...
💬 1[Last reply:1 day ago] 这是由于在配音后暂停时间设置过长,导致系统计时器溢出。解决方案:打开软件,点击顶部菜单栏的“工具/选项”。选择“高级选项”。在“字幕配音调整”区域,找到“配音后暂停秒”设置项。将该数值修改为一个较小的值,例如 5 或 10。保存设置并重新尝试任务。请查阅相关文档:高级设置各个选项说明...111.14* Posted at: 1 day ago -
#3518 under win 11 pyvideotransv3.97 always return [1.0%] An error has occurred. There may be insufficient memory or video mem...
💬 3[Last reply:1 day ago] 问题核心在于软件未能正确识别已手动下载的模型文件,仍尝试从网络下载,且下载失败后触发了错误的“显存不足”提示。这通常是由于模型文件不完整、文件夹命名错误或软件缓存未更新导致的。解决方案如下:验证模型文件完整性:进入 models/models--Systran--faster-whisper-large-v3 文件夹。...113.234* Posted at: 1 day ago -
#3517 pyimod03_ctypes.install.<locals>.PyInstallerImportError: Failed to load dynlib/dll 'C:\\dich\\win-pyvideotrans-v3.97-030...
💬 1[Last reply:1 day ago] This error is caused by the missing Microsoft.CognitiveServices.Speech.core.dll file, which is required for the AzureTTS functionality. This typically happens i...2405:4802* Posted at: 1 day ago -
#3516 The Gemini API is still available, but it's reporting that it's out of stock....
💬 1[Last reply:1 day ago] 这是由于 Gemini API 的配额或可用性问题导致的,通常与 Google 的服务状态或你的账户配额限制有关。检查服务状态与配额:登录 Google AI Studio 或 Google Cloud Console,确认 Gemini API 服务是否正常运行,以及你的 API 密钥是否有足够的请求配额或是否已启用...2001:ee0* Posted at: 1 day ago -
#3515 ModuleNotFoundError: No module named 'qwen_tts'...
💬 3[Last reply:1 day ago] The error ModuleNotFoundError: No module named 'qwen_tts' indicates that the Python package required for the Qwen-TTS (local) voice synthesis channel ...111.55* Posted at: 1 day ago
Open source and free maintenance is not easy. If this project is helpful to you, please consider making a small donation to help the project continue to maintain and update.