-
#3546 403 Client Error: Forbidden for url: https://ark.cn-beijing.volces.com/api/v3/chat/completions...
💬 1[Last reply:2 months ago] 这是由于字节火山方舟翻译渠道的 API 请求被拒绝(403 错误)导致的。通常是因为 API 密钥无效、过期,或请求的模型/服务未开通。解决方案:检查 API 密钥和配置:打开 pyVideoTrans 的 菜单 -> 翻译设置 -> 字节火山方舟。确认 API Key 和 Secret Key 填写正确且未过期。请确保复制的是完整的密钥,没有多余的空格或换行。确认 API URL 填...213.130* Posted at: 2 months ago -
#3545 linux系统部署版,无法上传音视频,python test显示报错...
💬 1[Last reply:2 months ago] 这是由于 FFmpeg 未正确安装或环境变量未配置导致的。Linux 源码部署版本依赖系统已安装的 FFmpeg,上述错误表明软件调用 FFmpeg 处理音频文件时失败。解决方案:安装 FFmpeg:在终端中运行以下命令安装 FFmpeg。sudo apt update sudo apt install ffmpeg验证安装:安装后,在终端运行 ffmpeg -version,确认能正常输出版本信...103.151* Posted at: 2 months ago -
#3544 TaskCfgSTT(is_cuda=True, uuid='e1dbb01d50', cache_folder='D:/Program Files/pyvideotrans/tmp/1468/e1dbb01d50', target_dir='D:/Program Files/pyvideotrans/output/recogn', source_langu...
💬 1[Last reply:2 months ago] 该错误是由于内存或显存不足,导致语音识别进程池中的进程被意外终止。解决方案:降低模型大小:你当前使用的是 tiny 模型。虽然它最小最快,但准确度很低,且此错误表明系统资源仍不足以稳定运行。请尝试以下操作:在语音识别渠道的下拉菜单中,将模型从 tiny 更换为 base 或 small。如果仍报错,请继续尝试更小的模型,直到能稳定运行。注意:.en结尾和distil-开头的模型仅支持英语发音。如果...61.8* Posted at: 2 months ago -
#3543 invalid literal for int() with base 10: '1,048,576'...
💬 5[Last reply:2 months ago] The core knowledge base for pyVideoTrans does not contain specific information about the "thinking budget" parameter for the Gemini AI API or whether '-1' is an accepted value.This is a configuration ...115.98* Posted at: 2 months ago -
#3542 TaskCfg(cache_folder='C:/pyvideotrans/tmp/10972/bfe7ec9918', target_dir='C:/pyvideotrans/output/tts', remove_noise=False, is_separate=False, detect_language=None, subtitle_language...
💬 1[Last reply:2 months ago] The conversion failed because the generated MP3 audio file (C:/pyvideotrans/output/tts/20260309-181113.mp3) is corrupted or invalid. The error pydub.exceptions.CouldntDecodeError: Decoding failed. ffm...108.7* Posted at: 2 months ago -
#3541 google.genai.errors.ClientError: 429 RESOURCE_EXHAUSTED. {'error': {'code': 429, 'message': 'You exceeded your current quota, please check your plan and billing details. For more i...
💬 1[Last reply:2 months ago] This is due to the Gemini TTS API's free tier quota being exceeded. The error indicates you have exceeded the limit of 10 free requests per day for the gemini-2.5-flash-tts model.Solution:Switch to a ...108.7* Posted at: 2 months ago -
#3540 实时语音转文字怎么使用ollama作为翻译引擎?为什么找不到切换翻译引擎的入口,是v3.92这个版本没有这个功能吗?...
💬 1[Last reply:2 months ago] 你的问题涉及两个部分:一是实时语音转文字功能如何使用 Ollama 作为翻译引擎,二是在 v3.92 版本中找不到切换翻译引擎的入口。关于实时语音转文字功能:根据核心知识库,pyVideoTrans 的“实时语音转文字”功能(如果存在)主要用于语音转录(ASR),其核心是将语音实时转换为文字,通常不涉及翻译环节。翻译功能主要在“视频翻译”或“批量字幕翻译”工作流中使用。因此,实时语音转文字功能本身...223.73* Posted at: 2 months ago -
#3539 TaskCfgTTS(is_cuda=True, uuid='140aae877e', cache_folder='D:/pyvideotrans/win-pyvideotrans-v3.97/tmp/13600/140aae877e', target_dir='D:/pyvideotrans/win-pyvideotrans-v3.97/output/tt...
💬 1[Last reply:2 months ago] 该错误是由于 Qwen3-TTS(本地) 配音渠道的 API 服务未正确启动或连接失败导致的。解决方案:确认 Qwen3-TTS 服务已启动:确保你已按照官方文档部署了 Qwen-TTS 的 API 服务(例如,通过 python app.py 启动了一个 WebUI 服务)。服务通常运行在 http://127.0.0.1:7860 或类似地址。检查 pyVideoTrans 中的配置:在 py...156.226* Posted at: 2 months ago -
#3538 OSError: cannot load library '/Users/wulinye/Desktop/project/pyvideotrans/.venv/lib/python3.10/site-packages/_soundfile_data/libsndfile.dylib': dlopen(/Users/wulinye/Desktop/projec...
💬 1[Last reply:2 months ago] 这是由于 macOS 系统缺少 libsndfile 音频库依赖导致的。安装 libsndfile:打开终端,使用 Homebrew 包管理器安装该库。如果尚未安装 Homebrew,请先访问 https://brew.sh 安装。在终端中执行命令:brew install libsndfile验证安装:安装完成后,重启 pyVideoTrans 软件。请查阅相关文档:MacOS源码部署视频翻译软...141.11* Posted at: 2 months ago -
#3537 TaskCfgSTT(is_cuda=True, uuid='8052205b4a', cache_folder='D:/program/win-videotrans/tmp/28032/8052205b4a', target_dir='C:/Users/郭强/Videos/pyvideotrans/recogn', source_language=None...
💬 1[Last reply:2 months ago] 这是由于 faster-whisper 依赖的 tokenizers 库版本不兼容或损坏导致的。解决方案:清理并重新下载模型:关闭 pyVideoTrans 软件。进入软件安装目录下的 models 文件夹。删除与 faster-whisper 相关的模型文件夹(例如 models--Systran--faster-whisper-large-v3-turbo)。重新启动软件,再次尝试语音识别,软...2409:8a1b* Posted at: 2 months ago -
#3536 OSError: cannot load library '/Users/ruby/pyvideotrans/pyvideotrans/.venv/lib/python3.10/site-packages/_soundfile_data/libsndfile.dylib': dlopen(/Users/ruby/pyvideotrans/pyvideotra...
💬 3[Last reply:2 months ago] 这是由于软件启动失败,无法通过常规方式重启。问题根源是缺少 libsndfile 库,导致 Python 模块 soundfile 在导入时崩溃,软件无法正常启动。解决方案:确保依赖已安装:在终端中执行 brew install libsndfile,确保命令成功执行,没有报错。激活虚拟环境并重装模块:打开终端,导航到你的 pyVideoTrans 项目目录:cd /Users/ruby/pyvi...2409:8a55* Posted at: 2 months ago -
#3535 为什么自定义翻译API的输入框,无法输入且删除里面的内容,...
💬 1[Last reply:2 months ago] 这是由于 pyVideoTrans 软件界面中自定义翻译 API 输入框的文本被锁定为只读状态,无法直接编辑。解决方案:请点击输入框右侧的 “编辑” 按钮。点击后,输入框将解除锁定,允许您修改或删除其中的内容。修改完成后,点击 “保存” 按钮以应用更改。原因说明:该设计是为了防止用户误操作修改了预设的 API 请求模板。必须通过点击“编辑”按钮来主动启用编辑模式。请查阅相关文档:自定义 翻译 ap...223.73* Posted at: 2 months ago -
#3534 RuntimeError: Argument #4: Padding size should be less than the corresponding input dimension, but got: padding (2, 2) at dimension 2 of input [1, 128, 1]...
💬 1[Last reply:2 months ago] 该错误是由于使用 Qwen-TTS(本地) 进行声音克隆时,参考音频片段过短(或无效)导致模型无法提取有效的说话人嵌入特征。解决方案:确保参考音频长度合适:声音克隆需要 3-10 秒的清晰人声作为参考音频。请检查语音识别阶段生成的字幕片段时长。调整语音识别参数:打开 菜单 -> 工具 -> 高级选项。在 【语音识别参数】 区域,将 最短语音持续毫秒 设置为 3000(即3秒)。将 最长...120.229* Posted at: 2 months ago -
#3533 TaskCfgVTT(is_cuda=False, uuid='342bdc5d2a', cache_folder='D:/数字媒体/win-pyvideotrans-v3.97-0304/tmp/5424/342bdc5d2a', target_dir='D:/数字媒体/_video_out/5. 量化 - 数字音频基础【机翻双字】-mp4', sourc...
💬 1[Last reply:2 months ago] 这是由于 faster-whisper(本地) 语音识别模型文件 model.bin 下载不完整或已损坏导致的。解决方案:手动下载并替换模型文件:根据你使用的模型 large-v3,在软件根目录下的 models 文件夹内,创建名为 models--Systran--faster-whisper-large-v3 的文件夹。访问模型下载地址:https://huggingface.co/Systr...2409:895a* Posted at: 2 months ago -
#3532 pyimod03_ctypes.install.<locals>.PyInstallerImportError: Failed to load dynlib/dll 'D:\\11\\_internal\\azure\\cognitiveservices\\speech\\Microsoft.CognitiveServices.Speech.core.dll...
💬 1[Last reply:2 months ago] 这是由于操作系统缺少必要的 VC++ 运行库,导致 Azure TTS 依赖的 DLL 文件无法加载。解决方案:下载并安装微软 VC++ 可再发行组件包。请访问以下链接下载并运行安装程序:微软VC++组件下载地址安装完成后,重启计算机。重新启动 pyVideoTrans 软件。如果问题仍然存在,请检查您下载的软件包是否完整。如果您下载的是“补丁包”,请重新下载完整的软件包(.7z 压缩包)并解压到...104.249* Posted at: 2 months ago -
#3531 RuntimeError: File model.bin is incomplete: failed to read a buffer of size 13107200 at position 446498790...
💬 1[Last reply:2 months ago] 这是由于 faster-whisper 模型文件 model.bin 下载不完整或已损坏导致的。解决方案:手动下载并替换模型文件:前往 HuggingFace 模型页面:https://huggingface.co/Systran/faster-whisper-large-v3/tree/main将该页面上的所有 .json、.bin、.txt 文件下载到本地。在 pyVideoTrans 软件根...2408:8221* Posted at: 2 months ago -
#3530 怎么设置没人讲话时不显示字幕,而不是那个字幕从头到尾一直挂着...
💬 1[Last reply:2 months ago] 要实现“没人讲话时不显示字幕”,即字幕仅在说话时出现,需要确保字幕文件的时间轴与语音片段精确对齐。这主要取决于语音识别(ASR)步骤的准确性。核心原因:字幕时间轴不精确,导致静音部分也显示了字幕。解决方案:优化语音识别参数:在软件主界面,点击“设置更多参数...”。在“语音识别参数”区域,调整以下关键设置:语音阈值:适当提高(例如从默认的0.5提高到0.6或0.7),以减少将背景噪音误识别为语音的...120.236* Posted at: 2 months ago -
#3529 字幕识别完就自动下载,字幕栏清空了,没有记录...
💬 1[Last reply:2 months ago] 这是由于软件在语音识别完成后自动进入了翻译阶段,但翻译渠道配置可能存在问题(如未配置API Key或网络连接失败),导致翻译失败并清空了字幕栏。请按以下步骤排查:检查翻译渠道配置:确认你选择的翻译渠道(如 OpenAI、DeepSeek、Google 等)已正确配置。如果是需要 API Key 的渠道(如 OpenAI、DeepSeek),请进入 菜单 -> 翻译设置,找到对应渠道的设置面板...38.90* Posted at: 2 months ago -
#3528 画质砍半了啊怎么设置保留原画质啊...
💬 1[Last reply:2 months ago] 视频输出画质下降通常是由于视频编码参数设置不当导致的。核心原因是软件默认的“视频输出质量控制”和“输出视频压缩率”参数为了平衡文件大小和速度,可能降低了画质。解决方案:打开软件,点击顶部菜单栏的“工具/选项” -> “高级选项”。在“视频输出控制”区域,找到以下两个参数进行调整:视频输出质量控制:将此值调低以提高画质。默认值可能在 23 左右,数值越低画质越好(0 为无损,但文件会非常大)。...2409:8a50* Posted at: 2 months ago -
#3527 未获取到角色列表=system:Windows-10-10.0.19045-SP0version:v3.97frozen:Truelanguage:zhroot_dir:C:/Users/Administrator/AppData/Loca......
💬 1[Last reply:2 months ago] 这是由于 Edge-TTS 渠道在获取可用配音角色列表时网络连接失败导致的。解决方案:检查网络连接:确保你的计算机可以正常访问互联网,特别是能够连接到微软的 Edge-TTS 服务。调整高级设置:在软件顶部菜单栏,点击 工具/选项 -> 高级选项,在“字幕配音调整”区域,将 EdgeTTS配音渠道配音并发数 设为 1,并将 EdgeTTS配音渠道失败重试次数 适当调高(例如 5)。重启软件:...188.253* Posted at: 2 months ago
Open source and free maintenance is not easy. If this project is helpful to you, please consider making a small donation to help the project continue to maintain and update.