-
#3544 TaskCfgSTT(is_cuda=True, uuid='e1dbb01d50', cache_folder='D:/Program Files/pyvideotrans/tmp/1468/e1dbb01d50', target_dir...
💬 1[Last reply:30 minutes ago] 该错误是由于内存或显存不足,导致语音识别进程池中的进程被意外终止。解决方案:降低模型大小:你当前使用的是 tiny 模型。虽然它最小最快,但准确度很低,且此错误表明系统资源仍不足以稳定运行。请尝试以下操作:在语音识别渠道的下拉菜单中,将模型从 tiny 更换为 base 或 small。如果仍报错,请继续尝试更小的模型...61.8* Posted at: 30 minutes ago -
#3543 invalid literal for int() with base 10: '1,048,576'...
💬 5[Last reply:2 hours ago] The core knowledge base for pyVideoTrans does not contain specific information about the "thinking budget" parameter for the Gemini AI API or whether '-1' is an...115.98* Posted at: 2 hours ago -
#3542 TaskCfg(cache_folder='C:/pyvideotrans/tmp/10972/bfe7ec9918', target_dir='C:/pyvideotrans/output/tts', remove_noise=False...
💬 1[Last reply:10 hours ago] The conversion failed because the generated MP3 audio file (C:/pyvideotrans/output/tts/20260309-181113.mp3) is corrupted or invalid. The error pydub.exceptions....108.7* Posted at: 10 hours ago -
#3541 google.genai.errors.ClientError: 429 RESOURCE_EXHAUSTED. {'error': {'code': 429, 'message': 'You exceeded your current q...
💬 1[Last reply:11 hours ago] This is due to the Gemini TTS API's free tier quota being exceeded. The error indicates you have exceeded the limit of 10 free requests per day for the gemini-2...108.7* Posted at: 11 hours ago -
#3540 实时语音转文字怎么使用ollama作为翻译引擎?为什么找不到切换翻译引擎的入口,是v3.92这个版本没有这个功能吗?...
💬 1[Last reply:15 hours ago] 你的问题涉及两个部分:一是实时语音转文字功能如何使用 Ollama 作为翻译引擎,二是在 v3.92 版本中找不到切换翻译引擎的入口。关于实时语音转文字功能:根据核心知识库,pyVideoTrans 的“实时语音转文字”功能(如果存在)主要用于语音转录(ASR),其核心是将语音实时转换为文字,通常不涉及翻译环节。翻译功...223.73* Posted at: 15 hours ago -
#3539 TaskCfgTTS(is_cuda=True, uuid='140aae877e', cache_folder='D:/pyvideotrans/win-pyvideotrans-v3.97/tmp/13600/140aae877e', ...
💬 1[Last reply:19 hours ago] 该错误是由于 Qwen3-TTS(本地) 配音渠道的 API 服务未正确启动或连接失败导致的。解决方案:确认 Qwen3-TTS 服务已启动:确保你已按照官方文档部署了 Qwen-TTS 的 API 服务(例如,通过 python app.py 启动了一个 WebUI 服务)。服务通常运行在 http://127.0....156.226* Posted at: 19 hours ago -
#3538 OSError: cannot load library '/Users/wulinye/Desktop/project/pyvideotrans/.venv/lib/python3.10/site-packages/_soundfile_...
💬 1[Last reply:20 hours ago] 这是由于 macOS 系统缺少 libsndfile 音频库依赖导致的。安装 libsndfile:打开终端,使用 Homebrew 包管理器安装该库。如果尚未安装 Homebrew,请先访问 https://brew.sh 安装。在终端中执行命令:brew install libsndfile验证安装:安装完成后,重...141.11* Posted at: 20 hours ago -
#3537 TaskCfgSTT(is_cuda=True, uuid='8052205b4a', cache_folder='D:/program/win-videotrans/tmp/28032/8052205b4a', target_dir='C...
💬 1[Last reply:21 hours ago] 这是由于 faster-whisper 依赖的 tokenizers 库版本不兼容或损坏导致的。解决方案:清理并重新下载模型:关闭 pyVideoTrans 软件。进入软件安装目录下的 models 文件夹。删除与 faster-whisper 相关的模型文件夹(例如 models--Systran--faster-w...2409:8a1b* Posted at: 21 hours ago -
#3536 OSError: cannot load library '/Users/ruby/pyvideotrans/pyvideotrans/.venv/lib/python3.10/site-packages/_soundfile_data/l...
💬 3[Last reply:21 hours ago] 这是由于软件启动失败,无法通过常规方式重启。问题根源是缺少 libsndfile 库,导致 Python 模块 soundfile 在导入时崩溃,软件无法正常启动。解决方案:确保依赖已安装:在终端中执行 brew install libsndfile,确保命令成功执行,没有报错。激活虚拟环境并重装模块:打开终端,导航到...2409:8a55* Posted at: 21 hours ago -
#3535 为什么自定义翻译API的输入框,无法输入且删除里面的内容,...
💬 1[Last reply:22 hours ago] 这是由于 pyVideoTrans 软件界面中自定义翻译 API 输入框的文本被锁定为只读状态,无法直接编辑。解决方案:请点击输入框右侧的 “编辑” 按钮。点击后,输入框将解除锁定,允许您修改或删除其中的内容。修改完成后,点击 “保存” 按钮以应用更改。原因说明:该设计是为了防止用户误操作修改了预设的 API 请求模板...223.73* Posted at: 22 hours ago -
#3534 RuntimeError: Argument #4: Padding size should be less than the corresponding input dimension, but got: padding (2, 2) a...
💬 1[Last reply:1 day ago] 该错误是由于使用 Qwen-TTS(本地) 进行声音克隆时,参考音频片段过短(或无效)导致模型无法提取有效的说话人嵌入特征。解决方案:确保参考音频长度合适:声音克隆需要 3-10 秒的清晰人声作为参考音频。请检查语音识别阶段生成的字幕片段时长。调整语音识别参数:打开 菜单 -> 工具 -> 高级选项。在 【...120.229* Posted at: 1 day ago -
#3533 TaskCfgVTT(is_cuda=False, uuid='342bdc5d2a', cache_folder='D:/数字媒体/win-pyvideotrans-v3.97-0304/tmp/5424/342bdc5d2a', tar...
💬 1[Last reply:1 day ago] 这是由于 faster-whisper(本地) 语音识别模型文件 model.bin 下载不完整或已损坏导致的。解决方案:手动下载并替换模型文件:根据你使用的模型 large-v3,在软件根目录下的 models 文件夹内,创建名为 models--Systran--faster-whisper-large-v3 的文...2409:895a* Posted at: 1 day ago -
#3532 pyimod03_ctypes.install.<locals>.PyInstallerImportError: Failed to load dynlib/dll 'D:\\11\\_internal\\azure\\cognitives...
💬 1[Last reply:1 day ago] 这是由于操作系统缺少必要的 VC++ 运行库,导致 Azure TTS 依赖的 DLL 文件无法加载。解决方案:下载并安装微软 VC++ 可再发行组件包。请访问以下链接下载并运行安装程序:微软VC++组件下载地址安装完成后,重启计算机。重新启动 pyVideoTrans 软件。如果问题仍然存在,请检查您下载的软件包是否...104.249* Posted at: 1 day ago -
#3531 RuntimeError: File model.bin is incomplete: failed to read a buffer of size 13107200 at position 446498790...
💬 1[Last reply:1 day ago] 这是由于 faster-whisper 模型文件 model.bin 下载不完整或已损坏导致的。解决方案:手动下载并替换模型文件:前往 HuggingFace 模型页面:https://huggingface.co/Systran/faster-whisper-large-v3/tree/main将该页面上的所有 .j...2408:8221* Posted at: 1 day ago -
#3530 怎么设置没人讲话时不显示字幕,而不是那个字幕从头到尾一直挂着...
💬 1[Last reply:1 day ago] 要实现“没人讲话时不显示字幕”,即字幕仅在说话时出现,需要确保字幕文件的时间轴与语音片段精确对齐。这主要取决于语音识别(ASR)步骤的准确性。核心原因:字幕时间轴不精确,导致静音部分也显示了字幕。解决方案:优化语音识别参数:在软件主界面,点击“设置更多参数...”。在“语音识别参数”区域,调整以下关键设置:语音阈值:适...120.236* Posted at: 1 day ago -
#3529 字幕识别完就自动下载,字幕栏清空了,没有记录...
💬 1[Last reply:1 day ago] 这是由于软件在语音识别完成后自动进入了翻译阶段,但翻译渠道配置可能存在问题(如未配置API Key或网络连接失败),导致翻译失败并清空了字幕栏。请按以下步骤排查:检查翻译渠道配置:确认你选择的翻译渠道(如 OpenAI、DeepSeek、Google 等)已正确配置。如果是需要 API Key 的渠道(如 OpenAI...38.90* Posted at: 1 day ago -
#3528 画质砍半了啊怎么设置保留原画质啊...
💬 1[Last reply:1 day ago] 视频输出画质下降通常是由于视频编码参数设置不当导致的。核心原因是软件默认的“视频输出质量控制”和“输出视频压缩率”参数为了平衡文件大小和速度,可能降低了画质。解决方案:打开软件,点击顶部菜单栏的“工具/选项” -> “高级选项”。在“视频输出控制”区域,找到以下两个参数进行调整:视频输出质量控制:将此值调低以提高...2409:8a50* Posted at: 1 day ago -
#3527 未获取到角色列表=system:Windows-10-10.0.19045-SP0version:v3.97frozen:Truelanguage:zhroot_dir:C:/Users/Administrator/AppData/Loca...
💬 1[Last reply:1 day ago] 这是由于 Edge-TTS 渠道在获取可用配音角色列表时网络连接失败导致的。解决方案:检查网络连接:确保你的计算机可以正常访问互联网,特别是能够连接到微软的 Edge-TTS 服务。调整高级设置:在软件顶部菜单栏,点击 工具/选项 -> 高级选项,在“字幕配音调整”区域,将 EdgeTTS配音渠道配音并发数 设为...188.253* Posted at: 1 day ago -
#3526 RuntimeError: cuBLAS failed with status CUBLAS_STATUS_NOT_INITIALIZED...
💬 1[Last reply:1 day ago] 这是由于 CUDA 环境未正确初始化导致 cuBLAS 库调用失败。通常发生在 NVIDIA 显卡驱动、CUDA 或 cuDNN 版本不匹配或未正确安装时。解决方案:验证 CUDA 安装:打开命令提示符 (CMD),输入 nvcc -V 查看 CUDA 版本。pyVideoTrans 内置支持 CUDA 12.8。输入...144.48* Posted at: 1 day ago -
#3525 RuntimeError: File model.bin is incomplete: failed to read a buffer of size 3276800 at position 500134913...
💬 1[Last reply:1 day ago] 该错误是由于 faster-whisper 语音识别模型文件 model.bin 下载不完整或已损坏导致的。解决方案:手动下载并替换模型文件:根据你使用的模型(例如 large-v3),在软件根目录的 models 文件夹内,找到对应的模型文件夹(例如 models--Systran--faster-whisper-l...144.48* Posted at: 1 day ago
Open source and free maintenance is not easy. If this project is helpful to you, please consider making a small donation to help the project continue to maintain and update.