-
#4135 TaskCfgSTT(is_cuda=True, uuid='5b5ab85bf3', cache_folder='C:/pyvideotrans/tmp/13216/5b5ab85bf3', target_dir='C:/SOFT/pyvideotrans/output/recogn', source_language=None, source_langu...
💬 1[Last reply:2 months ago] 这是由于 Gradio Client 无法连接到您部署在 Google Colab 的 VibeVoice-ASR 服务的公共 URL 导致的。解决方案:确认服务状态:首先,请确保您的 Google Colab 笔记本中 VibeVoice-ASR 的 Gradio 服务正在运行,并且已成功生成了一个 public URL(通常以 *.gradio.live 结尾)。检查防火墙/网络:Google...103.62* Posted at: 2 months ago -
#4134 root@RainYun-8HTeGSfr:~/VocalSeparate/pyvideotrans# uv run sp.pyTraceback (most recent call last): File "/root/VocalSep......
💬 5[Last reply:2 months ago] 这是由于您下载的源码版本不包含 webui.py 文件。该文件可能仅在特定版本或分支中提供。核心原因:您当前的 pyVideoTrans 源码目录中没有 webui.py 文件。解决方案:确认版本:请检查您下载的版本是否为最新版 v3.99,并确认该版本是否包含 WebUI 功能。您可以访问项目主页或文档查看。下载完整包:如果当前版本确实不包含 WebUI,您需要下载包含该文件的完整源码包。源码仓...154.9* Posted at: 2 months ago -
#4132 语音识别的提示词在哪个文件中设置...
💬 13[Last reply:2 months ago] 配音语速参数在 v3.99 版本中已得到修正,现在可以正常生效。该参数用于整体调整配音的语速,以应对不同语言间表达时长差异带来的音画同步问题。使用方法与原理:参数位置:在主界面“配音角色”下拉菜单右侧,有“配音语速”输入框。参数含义:输入百分比数值。正值表示加速,负值表示减速。例如:输入 10 表示语速加快 10%,输入 -20 表示语速减慢 20%。生效时机:该调整会在每一句字幕的配音生成时应用...103.172* Posted at: 2 months ago -
#4133 TaskCfgVTT(is_cuda=True, uuid='8559824178', cache_folder='E:/usr/Application/AI-Models/apps/pyvideotrans/tmp/22488/8559824178', target_dir='A:/[Video-Cache]/_video_out/2026-04-01_0...
💬 1[Last reply:2 months ago] 这是由于显存不足或GPU进程池崩溃导致的。错误信息显示在使用 faster-whisper(本地) 的 large-v3 模型进行语音识别时,GPU进程池意外终止,提示可能内存或显存不足。解决方案:使用更小的模型:在语音识别渠道的下拉菜单中,将模型从 large-v3 更换为 medium、small 或 base。large-v3 模型最低需要约10GB显存。调整高级设置以降低显存占用:进入 菜...183.208* Posted at: 2 months ago -
#4131 src目录下的deepseek.txt该怎样使用...
💬 1[Last reply:2 months ago] src目录下的deepseek.txt文件是用于配置DeepSeek AI翻译渠道的提示词文件。该文件允许你自定义AI翻译时的指令,以优化翻译效果。使用方法:找到文件:在软件安装目录下的 src/prompts/ 文件夹中,找到 deepseek.txt 文件。编辑内容:使用文本编辑器打开此文件,修改其中的提示词。你可以根据需求调整翻译风格、术语处理等指令。生效方式:修改并保存后,当你在软件中选择...103.172* Posted at: 2 months ago -
#4130 RuntimeError: 模型下载不完整,请删除目录 D:/百度网盘/models/models--mobiuslabsgmbh--faster-whisper-large-v3-turbo,重新下载...
💬 1[Last reply:2 months ago] 这是由于模型文件下载不完整或损坏导致的。按照错误提示,删除指定的模型目录:D:/百度网盘/models/models--mobiuslabsgmbh--faster-whisper-large-v3-turbo。重新启动 pyVideoTrans,在翻译界面选择 faster-whisper(本地) 渠道和 large-v3-turbo 模型,软件会自动重新下载。如果自动下载再次失败(通常因网络问...222.240* Posted at: 2 months ago -
#4129 v3.98升至v3.99后,语音识别和翻译结果怎么比之前更差?...
💬 7[Last reply:2 months ago] “重复惩罚”参数的合适值取决于具体任务和模型,没有绝对标准。它是一个需要根据输出效果进行微调的实验性参数。参数说明与建议范围:参数作用:“重复惩罚”用于抑制模型生成重复的词汇或短语。增大该值可以减少重复,但设置过高可能导致生成不流畅或遗漏合理重复的内容。建议范围:默认值通常为 1.0。调整范围一般在 1.0 到 1.5 之间。您可以以 0.1 或 0.2 为步进进行尝试。操作步骤:打开 菜单 -&...2409:8a55* Posted at: 2 months ago -
#4128 TaskCfgSTT(is_cuda=True, uuid='b2ec31ca8b', cache_folder='C:/pyvideotrans/tmp/6152/b2ec31ca8b', target_dir='C:/SOFT/pyvideotrans/output/recogn', source_language=None, source_langua...
💬 1[Last reply:2 months ago] 这是由于在切换 VAD 模型后,Qwen-ASR 本地识别过程中发生了 CUDA 非法内存访问错误,导致进程卡死并持续占用显存和内存。解决方案:强制终止残留进程:打开任务管理器(Ctrl+Shift+Esc),找到并结束所有残留的 Python 进程。检查 CUDA 环境:确保已正确安装 CUDA 12.8 和 cuDNN 9.x,并且显卡驱动为最新版本。在 CMD 中运行 nvcc -V 和 n...103.62* Posted at: 2 months ago -
#4127 在m5芯片的mac使用本程序应该使用什么本地语音识别模型?...
💬 1[Last reply:2 months ago] 在搭载 M5 芯片的 Mac 上使用 pyVideoTrans,由于 M 系列芯片是 ARM 架构且不支持 NVIDIA CUDA,因此无法使用依赖 CUDA 加速的本地语音识别模型(如 faster-whisper 的 GPU 加速模式)。推荐使用以下本地语音识别模型:faster-whisper(本地):选择此渠道,但不要勾选主界面右上角的“CUDA加速”。软件将自动使用 CPU 进行推理。建...61.111* Posted at: 2 months ago -
#4126 如何部署pytorch来让本程序启用m系列芯片的mps加速?...
💬 1[Last reply:2 months ago] pyVideoTrans 目前不支持在 macOS 的 M 系列芯片上使用 PyTorch 的 MPS 后端进行加速。软件内置的本地语音识别(如 faster-whisper)和本地 TTS 模型主要依赖 CUDA 进行 GPU 加速,而 CUDA 是 NVIDIA 显卡的专有技术。对于 macOS 的 M 系列芯片,软件没有集成对 PyTorch MPS 后端的支持。解决方案:使用在线渠道:在语...61.111* Posted at: 2 months ago -
#4125 如何配置macos下m系列芯片的mps加速?具体步骤如何?...
💬 1[Last reply:2 months ago] pyVideoTrans 目前主要支持 NVIDIA 显卡的 CUDA 加速。对于 macOS 的 M 系列芯片,软件并未内置官方的 MPS (Metal Performance Shaders) 加速支持。解决方案:使用 CPU 模式:在软件中,请确保不要勾选主界面上的“CUDA加速”选项。语音识别和本地 TTS 将使用 CPU 进行计算,但处理速度会较慢。尝试源码部署:通过 git clone...61.111* Posted at: 2 months ago -
#4124 /Users/npx/Documents/pyvideotrans/.venv/lib/python3.10/site-packages/zhconv/zhconv.py:33: UserWarning: pkg_resources is ......
💬 1[Last reply:2 months ago] 这是由于在 macOS 上使用 CPU 运行大型 Whisper 模型(large-v3)导致处理速度极慢,进度条卡住是正常现象。macOS 的 M 系列芯片可以通过配置 GPU 加速来大幅提升速度。解决方案:确认环境:确保已按照 macOS 源码部署指南正确安装 FFmpeg 和 Python 环境。配置 MPS 加速(Apple Silicon 芯片):打开软件,进入顶部菜单栏的 工具/选项 ...61.111* Posted at: 2 months ago -
#4123 /Users/x/Documents/pyvideotrans/.venv/lib/python3.10/site-packages/zhconv/zhconv.py:33: UserWarning: pkg_resources is de......
💬 1[Last reply:2 months ago] 这些警告信息是正常的,不会影响软件功能。第一行警告是关于 zhconv 库使用了即将被弃用的 pkg_resources API,这是第三方库的兼容性问题,不影响 pyVideoTrans 的核心运行。第二行警告是因为你在 CPU 模式下运行 Whisper 模型,而 CPU 不支持 FP16 浮点运算,因此自动回退到 FP32。这会导致处理速度变慢,但不会影响识别结果。解决方案:这些警告可以忽略...61.111* Posted at: 2 months ago -
#4122 faster-whisper不能CUDA...
💬 3[Last reply:2 months ago] 日志显示 is_cuda=True,说明软件已启用CUDA加速。但日志中未包含faster-whisper语音识别阶段的详细输出,无法直接判断CUDA是否被调用。问题可能在于CUDA环境不兼容或软件内部调用异常。解决方案:验证CUDA环境:在CMD中运行 nvcc -V 确认CUDA版本为12.8,运行 nvidia-smi 确认显卡驱动正常且支持CUDA。检查高级选项:在软件中点击 菜单 -&g...182.105* Posted at: 2 months ago -
#4121 requests.exceptions.HTTPError: 400 Client Error: Bad Request for url: http://127.0.0.1:29290/apitts...
💬 1[Last reply:2 months ago] 这是由于连接外部 TTS 服务(如 F5-TTS、GPT-SoVITS 等)时,API 请求被服务端拒绝(HTTP 400 错误)导致的。确认 TTS 服务是否正常运行:确保您启动的外部 TTS 服务(例如 F5-TTS、GPT-SoVITS、CosyVoice 等)的终端窗口没有关闭,且服务正在 http://127.0.0.1:29290 上正常运行。检查 API 地址配置:在 pyVideo...2400:8901* Posted at: 2 months ago -
#4119 ConnectionResetError: [WinError 10054] 远程主机强迫关闭了一个现有的连接。...
💬 17[Last reply:2 months ago] 好的,模型文件已经放好,现在进行下一步。请按顺序操作:1. 重启软件:完全关闭 pyVideoTrans(在任务栏右键点击图标选“关闭窗口”,或从任务管理器结束 sp.exe)。然后重新双击 sp.exe 打开软件。2. 选择文件:软件打开后,点击左上角的 选择音频或视频 按钮。在弹出的窗口中,找到并选中你的英文音频或视频文件,点击“打开”。3. 配置主界面:在“语音识别”下拉菜单中,选择 ...194.156* Posted at: 2 months ago -
#4120 RuntimeError: {'message': 'tts failed', 'Exception': 'expected scalar type Half but found Float'}...
💬 1[Last reply:2 months ago] 这是由于 TTS 模型数据类型不匹配导致的。具体是模型期望使用 Half (float16) 数据类型,但输入数据是 Float (float32) 类型。解决方案:进入软件顶部菜单栏,选择 工具/选项 -> 高级选项。在打开的窗口中,找到 【语音识别参数】 区域。找到 CUDA数据类型 选项。将其值从 float32 或 default 修改为 float16。点击 保存 按钮,然后关闭高...89.208* Posted at: 2 months ago -
#4118 videotrans.util.help_ffmpeg._FFprobeInternalError: [mov,mp4,m4a,3gp,3g2,mj2 @ 0000000000670b40] moov atom not found C:/Users/zhu/Desktop/ai翻译/tmp/10444/51c719c427/novoice.mp4: Inva...
💬 1[Last reply:2 months ago] 这是由于视频合成过程中,临时生成的无声视频文件 novoice.mp4 不完整或损坏(moov atom not found)导致的。解决方案:清理缓存并重新处理:在主界面左上角勾选 清理已生成 复选框,然后重新执行翻译任务。这会强制软件重新生成所有中间文件。检查文件路径:确保你的视频文件路径(包括 C:/Users/zhu/Desktop/ai翻译)不包含中文字符。建议将视频文件和软件都移动到纯...108.181* Posted at: 2 months ago -
#4117 Cannot connect to host speech.platform.bing.com:443 ssl:<ssl.SSLContext object at 0x00000179DF1F9DC0> [指定的网络名不再可用。]EdgeTTS...
💬 1[Last reply:2 months ago] 这是由于 Edge-TTS 服务连接不稳定或网络问题导致的。Edge-TTS 是微软的免费服务,在高并发或网络波动时可能出现连接中断。解决方案:降低并发请求:在软件顶部菜单栏,进入 工具/选项 -> 高级选项 -> 字幕配音调整 区域。将 并发配音线程数 设置为 1。将 配音后暂停秒 设置为 5 或更高(例如 10)。检查网络连接:确保你的网络连接稳定。如果使用了代理,请检查代理设置是...2408:8207* Posted at: 2 months ago -
#4116 TaskCfgVTT(is_cuda=True, uuid='64acb62b1d', cache_folder='F:/FanYi/win-pyvideotrans-v3.99/tmp/19960/64acb62b1d', target_dir='F:/FanYi/20260417-mp4', source_language='日语', source_la...
💬 1[Last reply:2 months ago] 这是由于网络连接问题导致的。错误信息 getaddrinfo failed 表明软件无法解析字节大模型的API服务器地址,通常是因为没有配置网络代理或代理设置不正确。解决方案:确认你的网络环境。字节火山等国内服务通常无需代理即可访问。请检查你的网络连接是否正常。检查软件的网络代理设置。在软件主界面的“网络代理地址”文本框中,如果你没有可用的代理服务,请将其留空。错误的代理地址(如 http://1...210.149* Posted at: 2 months ago
Open source and free maintenance is not easy. If this project is helpful to you, please consider making a small donation to help the project continue to maintain and update.
Dondate: ko-fi.com/jianchang512