-
#3552 我要用到配音渠道、说话人识别、模型等参数,完整命令。用微软的识别以及翻译...
💬 1[Last reply:3 months ago] 根据你的需求,你需要使用命令行模式(CLI)来执行一个完整的视频翻译任务,并指定使用微软的语音识别和翻译渠道。以下是基于知识库中 TaskCfgVTT 配置类和 CLI 使用说明构建的完整命令示例。核心命令结构:uv run cli.py --task vtv --name "你的视频文件路径" --source_language_code zh --target_langua...154.3* Posted at: 3 months ago -
#3551 TaskCfgTTS(is_cuda=False, uuid='30af9ccb4f', cache_folder='E:/Download_File/Folder/movietools/pyvideotrans/tmp/4508/30af9ccb4f', target_dir='E:/Download_File/Folder/asmr/zimu/观念反转!...
💬 1[Last reply:3 months ago] 错误原因是配音对齐计算时,某条字幕的原始音频时长为0,导致计算加速倍数时出现除零错误。解决方案:检查字幕文件:打开 E:/Download_File/Folder/asmr/zimu/观念反转!淫荡女主播直播后遭男友饥渴线下诱骗/观念反转!淫荡女主播直播后遭男友饥渴线下诱骗_000.srt 文件,检查是否存在时间轴异常(例如开始时间等于结束时间,或时长极短)的字幕行。调整对齐设置:在软件主界面或“...203.10* Posted at: 3 months ago -
#3550 HTTPSConnectionPool(host='openspeech.bytedance.com', port=443): Max retries exceeded with url: /api/v1/vc/submit?appid=1070910001&language=en-US&use_itn=True&caption_type=speech&ma...
💬 1[Last reply:3 months ago] 该错误是由于与字节火山语音识别API的SSL连接失败导致的,通常与网络环境或软件版本有关。解决方案:升级软件版本:你当前使用的是 v3.91 版本。请先升级到最新版 v3.97,许多网络和API连接问题在新版本中已得到优化。检查网络连接:确保你的网络可以正常访问 openspeech.bytedance.com(字节火山服务)。如果在中国大陆,可能需要配置网络代理。配置网络代理:在软件主界面的“网...213.130* Posted at: 3 months ago -
#3549 我要用到配音渠道、说话人识别、模型等参数,完整命令...
💬 1[Last reply:3 months ago] 您需要的是使用 pyVideoTrans 命令行模式(CLI)进行视频翻译的完整命令示例,该命令应包含配音渠道、说话人识别、模型选择等参数的配置。根据知识库,命令行模式通过 cli.py 调用,核心任务类型为 vtv(视频翻译)。以下是包含您所需参数的完整命令示例:uv run cli.py --task vtv --name "your_video.mp4" --source...154.3* Posted at: 3 months ago -
#3548 uv run cli.py --task vtv --name "视频路径" --source_language_code "源语言" --target_language_code "目标语言" [可选参数],用这个命令为什么不能直接翻译出......
💬 1[Last reply:3 months ago] 这是因为命令行模式默认配置可能未指定配音渠道和角色,导致只生成翻译后的字幕而没有配音。要使用命令行模式生成带中文配音的视频,需要额外指定配音相关的参数。以下是解决方案:检查必要参数:确保至少指定了以下核心参数:--tts_type:指定配音渠道(例如,使用 Edge-TTS 免费渠道可设为 1)。--voice_role:指定配音角色(例如,中文女声可设为 zh-CN-XiaoxiaoNeural...154.3* Posted at: 3 months ago -
#3547 [2026-03-10 18:51:41,716] ERROR in start: [api]error: 400 Bad Request: The browser (or proxy) sent a request that this s......
💬 1[Last reply:3 months ago] 这是由于向外部 TTS 服务(如 F5-TTS、GPT-SoVITS 等)发送的 API 请求格式不正确或服务端无法理解导致的。检查 API 服务状态:确保你使用的 TTS 服务(如 F5-TTS、GPT-SoVITS、CosyVoice 等)已正确启动,并且其 API 服务正在运行(例如 http://127.0.0.1:7860 或 http://localhost:8000)。核对 API ...103.151* Posted at: 3 months ago -
#3546 403 Client Error: Forbidden for url: https://ark.cn-beijing.volces.com/api/v3/chat/completions...
💬 1[Last reply:3 months ago] 这是由于字节火山方舟翻译渠道的 API 请求被拒绝(403 错误)导致的。通常是因为 API 密钥无效、过期,或请求的模型/服务未开通。解决方案:检查 API 密钥和配置:打开 pyVideoTrans 的 菜单 -> 翻译设置 -> 字节火山方舟。确认 API Key 和 Secret Key 填写正确且未过期。请确保复制的是完整的密钥,没有多余的空格或换行。确认 API URL 填...213.130* Posted at: 3 months ago -
#3545 linux系统部署版,无法上传音视频,python test显示报错...
💬 1[Last reply:3 months ago] 这是由于 FFmpeg 未正确安装或环境变量未配置导致的。Linux 源码部署版本依赖系统已安装的 FFmpeg,上述错误表明软件调用 FFmpeg 处理音频文件时失败。解决方案:安装 FFmpeg:在终端中运行以下命令安装 FFmpeg。sudo apt update sudo apt install ffmpeg验证安装:安装后,在终端运行 ffmpeg -version,确认能正常输出版本信...103.151* Posted at: 3 months ago -
#3544 TaskCfgSTT(is_cuda=True, uuid='e1dbb01d50', cache_folder='D:/Program Files/pyvideotrans/tmp/1468/e1dbb01d50', target_dir='D:/Program Files/pyvideotrans/output/recogn', source_langu...
💬 1[Last reply:3 months ago] 该错误是由于内存或显存不足,导致语音识别进程池中的进程被意外终止。解决方案:降低模型大小:你当前使用的是 tiny 模型。虽然它最小最快,但准确度很低,且此错误表明系统资源仍不足以稳定运行。请尝试以下操作:在语音识别渠道的下拉菜单中,将模型从 tiny 更换为 base 或 small。如果仍报错,请继续尝试更小的模型,直到能稳定运行。注意:.en结尾和distil-开头的模型仅支持英语发音。如果...61.8* Posted at: 3 months ago -
#3543 invalid literal for int() with base 10: '1,048,576'...
💬 5[Last reply:3 months ago] The core knowledge base for pyVideoTrans does not contain specific information about the "thinking budget" parameter for the Gemini AI API or whether '-1' is an accepted value.This is a configuration ...115.98* Posted at: 3 months ago -
#3542 TaskCfg(cache_folder='C:/pyvideotrans/tmp/10972/bfe7ec9918', target_dir='C:/pyvideotrans/output/tts', remove_noise=False, is_separate=False, detect_language=None, subtitle_language...
💬 1[Last reply:3 months ago] The conversion failed because the generated MP3 audio file (C:/pyvideotrans/output/tts/20260309-181113.mp3) is corrupted or invalid. The error pydub.exceptions.CouldntDecodeError: Decoding failed. ffm...108.7* Posted at: 3 months ago -
#3541 google.genai.errors.ClientError: 429 RESOURCE_EXHAUSTED. {'error': {'code': 429, 'message': 'You exceeded your current quota, please check your plan and billing details. For more i...
💬 1[Last reply:3 months ago] This is due to the Gemini TTS API's free tier quota being exceeded. The error indicates you have exceeded the limit of 10 free requests per day for the gemini-2.5-flash-tts model.Solution:Switch to a ...108.7* Posted at: 3 months ago -
#3540 实时语音转文字怎么使用ollama作为翻译引擎?为什么找不到切换翻译引擎的入口,是v3.92这个版本没有这个功能吗?...
💬 1[Last reply:3 months ago] 你的问题涉及两个部分:一是实时语音转文字功能如何使用 Ollama 作为翻译引擎,二是在 v3.92 版本中找不到切换翻译引擎的入口。关于实时语音转文字功能:根据核心知识库,pyVideoTrans 的“实时语音转文字”功能(如果存在)主要用于语音转录(ASR),其核心是将语音实时转换为文字,通常不涉及翻译环节。翻译功能主要在“视频翻译”或“批量字幕翻译”工作流中使用。因此,实时语音转文字功能本身...223.73* Posted at: 3 months ago -
#3539 TaskCfgTTS(is_cuda=True, uuid='140aae877e', cache_folder='D:/pyvideotrans/win-pyvideotrans-v3.97/tmp/13600/140aae877e', target_dir='D:/pyvideotrans/win-pyvideotrans-v3.97/output/tt...
💬 1[Last reply:3 months ago] 该错误是由于 Qwen3-TTS(本地) 配音渠道的 API 服务未正确启动或连接失败导致的。解决方案:确认 Qwen3-TTS 服务已启动:确保你已按照官方文档部署了 Qwen-TTS 的 API 服务(例如,通过 python app.py 启动了一个 WebUI 服务)。服务通常运行在 http://127.0.0.1:7860 或类似地址。检查 pyVideoTrans 中的配置:在 py...156.226* Posted at: 3 months ago -
#3538 OSError: cannot load library '/Users/wulinye/Desktop/project/pyvideotrans/.venv/lib/python3.10/site-packages/_soundfile_data/libsndfile.dylib': dlopen(/Users/wulinye/Desktop/projec...
💬 1[Last reply:3 months ago] 这是由于 macOS 系统缺少 libsndfile 音频库依赖导致的。安装 libsndfile:打开终端,使用 Homebrew 包管理器安装该库。如果尚未安装 Homebrew,请先访问 https://brew.sh 安装。在终端中执行命令:brew install libsndfile验证安装:安装完成后,重启 pyVideoTrans 软件。请查阅相关文档:MacOS源码部署视频翻译软...141.11* Posted at: 3 months ago -
#3537 TaskCfgSTT(is_cuda=True, uuid='8052205b4a', cache_folder='D:/program/win-videotrans/tmp/28032/8052205b4a', target_dir='C:/Users/郭强/Videos/pyvideotrans/recogn', source_language=None...
💬 1[Last reply:3 months ago] 这是由于 faster-whisper 依赖的 tokenizers 库版本不兼容或损坏导致的。解决方案:清理并重新下载模型:关闭 pyVideoTrans 软件。进入软件安装目录下的 models 文件夹。删除与 faster-whisper 相关的模型文件夹(例如 models--Systran--faster-whisper-large-v3-turbo)。重新启动软件,再次尝试语音识别,软...2409:8a1b* Posted at: 3 months ago -
#3536 OSError: cannot load library '/Users/ruby/pyvideotrans/pyvideotrans/.venv/lib/python3.10/site-packages/_soundfile_data/libsndfile.dylib': dlopen(/Users/ruby/pyvideotrans/pyvideotra...
💬 3[Last reply:3 months ago] 这是由于软件启动失败,无法通过常规方式重启。问题根源是缺少 libsndfile 库,导致 Python 模块 soundfile 在导入时崩溃,软件无法正常启动。解决方案:确保依赖已安装:在终端中执行 brew install libsndfile,确保命令成功执行,没有报错。激活虚拟环境并重装模块:打开终端,导航到你的 pyVideoTrans 项目目录:cd /Users/ruby/pyvi...2409:8a55* Posted at: 3 months ago -
#3535 为什么自定义翻译API的输入框,无法输入且删除里面的内容,...
💬 1[Last reply:3 months ago] 这是由于 pyVideoTrans 软件界面中自定义翻译 API 输入框的文本被锁定为只读状态,无法直接编辑。解决方案:请点击输入框右侧的 “编辑” 按钮。点击后,输入框将解除锁定,允许您修改或删除其中的内容。修改完成后,点击 “保存” 按钮以应用更改。原因说明:该设计是为了防止用户误操作修改了预设的 API 请求模板。必须通过点击“编辑”按钮来主动启用编辑模式。请查阅相关文档:自定义 翻译 ap...223.73* Posted at: 3 months ago -
#3534 RuntimeError: Argument #4: Padding size should be less than the corresponding input dimension, but got: padding (2, 2) at dimension 2 of input [1, 128, 1]...
💬 1[Last reply:3 months ago] 该错误是由于使用 Qwen-TTS(本地) 进行声音克隆时,参考音频片段过短(或无效)导致模型无法提取有效的说话人嵌入特征。解决方案:确保参考音频长度合适:声音克隆需要 3-10 秒的清晰人声作为参考音频。请检查语音识别阶段生成的字幕片段时长。调整语音识别参数:打开 菜单 -> 工具 -> 高级选项。在 【语音识别参数】 区域,将 最短语音持续毫秒 设置为 3000(即3秒)。将 最长...120.229* Posted at: 3 months ago -
#3533 TaskCfgVTT(is_cuda=False, uuid='342bdc5d2a', cache_folder='D:/数字媒体/win-pyvideotrans-v3.97-0304/tmp/5424/342bdc5d2a', target_dir='D:/数字媒体/_video_out/5. 量化 - 数字音频基础【机翻双字】-mp4', sourc...
💬 1[Last reply:3 months ago] 这是由于 faster-whisper(本地) 语音识别模型文件 model.bin 下载不完整或已损坏导致的。解决方案:手动下载并替换模型文件:根据你使用的模型 large-v3,在软件根目录下的 models 文件夹内,创建名为 models--Systran--faster-whisper-large-v3 的文件夹。访问模型下载地址:https://huggingface.co/Systr...2409:895a* Posted at: 3 months ago
Open source and free maintenance is not easy. If this project is helpful to you, please consider making a small donation to help the project continue to maintain and update.
Dondate: ko-fi.com/jianchang512