-
#3049 TaskCfg(cache_folder='D:/win-videotrans-v3.76/tmp/25088/17053217fb', target_dir='C:/Users/dell/Desktop/下载-mp4', remove_noise=False, is_separate=False, detect_language='zh-cn', subt...
💬 1[Last reply:4 months ago] 这是由于 tokenizers 库版本不兼容或损坏导致的 faster-whisper 加载失败。解决方案:清理并重新安装依赖(适用于预打包版):关闭 pyVideoTrans 软件。进入软件安装目录(例如 D:\win-videotrans-v3.76)。找到并运行 0解压后立即点此安装运行环境.bat 或 install.bat 文件,重新安装和配置 Python 环境及依赖包。手动更新 to...91.199* Posted at: 4 months ago -
#3047 把GPT-SoVITS接入pyVedioTrans后,选择训练好的音色,为字幕配音,生成的音频没有声音.在浏览器中访问 http://127.0.0.1:9880/docs 看到一个Swagger UI页面打开的API文档页面中,点击 PO......
💬 9[Last reply:4 months ago] 这是由于 GPT-SoVITS 的 API 服务在处理 GET 请求时发生了内部错误。日志显示 POST /tts 请求成功(200 OK),但随后有一个 GET /tts 请求失败(500 Internal Server Error),错误原因是 'NoneType' object has no attribute 'lower',这表明服务在尝试处理一个...240e:341* Posted at: 4 months ago -
#3048 语音合成功能接入豆包大模型2.0...
💬 1[Last reply:4 months ago] 这是由于字节火山语音合成大模型2.0渠道的参数设置不当导致的,特别是“语速”和“音高”参数。请按以下步骤检查和调整:检查并调整高级参数:在软件主界面,点击菜单栏的“设置” -> “配音设置”。在“配音渠道”中选择“字节语音合成大模型2.0”。点击该渠道右侧的“设置”按钮。在弹出的设置窗口中,找到并调整以下关键参数:语速:默认值可能为 1.2 或更高,这会导致语速过快。请将其设置为 1.0(正...101.71* Posted at: 4 months ago -
#3046 这个两个用的是不是就是这个开源项目的产品...
💬 7[Last reply:4 months ago] 是的,模型下载可以不使用代理网络,但需要通过手动下载并放置模型文件的方式来实现。这是因为 HuggingFace 网站在国内直接访问通常受限。请按以下步骤操作:手动下载模型:访问 HuggingFace 镜像站(例如 https://hf-mirror.com/)。搜索并找到您需要的模型,例如 faster-whisper 的 large-v3 模型(路径如 Systran/faster-whis...2a02:6ea0* Posted at: 4 months ago -
#3045 这个没进度sh是不是我没安装模型呀,还是因为我电脑太慢了呢...
💬 1[Last reply:4 months ago] 这是由于未正确配置或启动本地语音识别模型(如 faster-whisper)导致的。界面显示“正在识别中...”,但进度条为0,通常意味着模型未加载或加载失败。解决方案:检查模型文件:确认软件根目录下的 models/ 文件夹中是否存在 faster-whisper 模型。模型文件夹命名应类似 models--Systran--faster-whisper-large-v3。如果文件夹为空或不存在...111.198* Posted at: 4 months ago -
#3044 requests.exceptions.HTTPError: 401 Client Error: Unauthorized for url: https://openrouter.ai/api/v1/chat/completions?sk=sk-or-v1-8832d273863b5fd7f1ca709cf372109ef8c2a3cbe4b4012e4e0...
💬 5[Last reply:4 months ago] 是的,自定义填写功能是用于接入自定义的、兼容 OpenAI 音频转录 (audio transcription) API 接口的语音识别服务。而 OpenRouter 提供的是 文本对话/补全 (Chat Completions) API,并非音频转录 API。因此,您收到的 401 错误是因为软件向 OpenRouter 的聊天接口发送了音频转录请求,而该接口不支持此功能。解决方案:要使用 Op...2a02:6ea0* Posted at: 4 months ago -
#3043 requests.exceptions.HTTPError: 404 Client Error: Not Found for url: https://openrouter.ai/api/v1/chat/completions%20%5C?sk=sk-or-v1-8832d273863b5fd7f1ca709cf372109ef8c2a3cbe4b4012e...
💬 1[Last reply:4 months ago] 这是由于在配置 OpenRouter AI 翻译渠道时,API URL 格式错误,导致请求地址不正确。解决方案:检查并修正 API URL:在软件设置中,找到 OpenRouter AI 翻译渠道的配置。确保 API URL 字段填写为 https://openrouter.ai/api/v1/chat/completions。你的错误日志显示 URL 末尾错误地附加了 API Key 参数(%2...2a02:6ea0* Posted at: 4 months ago -
#3042 requests.exceptions.ProxyError: HTTPSConnectionPool(host='openrouter.ai', port=443): Max retries exceeded with url: /api/v1/chat/completions%20%5C?sk=sk-or-v1-8832d273863b5fd7f1ca7...
💬 1[Last reply:4 months ago] 这是由于网络代理设置不正确或代理服务未运行导致的连接失败。检查并关闭代理设置:在软件菜单栏的“设置”或“高级选项”中,找到“网络代理”相关设置,清空代理地址文本框并保存。确认代理服务状态:如果你确实需要使用代理,请确保你的代理客户端(如 Clash、V2Ray 等)正在运行,并且代理地址(如 http://127.0.0.1:7890)和端口号填写正确。测试连接:修改设置后,重新测试你正在使用的功...2a02:6ea0* Posted at: 4 months ago -
#3041 除了本地模型支持多角色识别还有那些可以接入api来进行多角色识别呢...
💬 1[Last reply:4 months ago] 除了本地模型,可以通过接入以下API服务来实现多角色识别:WhisperX API:需要独立部署 whisperx-api 服务。该服务基于 WhisperX,支持更精准的时间轴和说话人分离功能。Pyannote 3.1:通过 HuggingFace 接口接入。需要在“语音识别参数”的高级选项中开启说话人分离,并填入你的 HuggingFace Token。这是效果最好的说话人分离模型之一。阿里 ...2a02:6ea0* Posted at: 4 months ago -
#3040 RuntimeError: File model.bin is incomplete: failed to read a buffer of size 3276800 at position 863007543...
💬 1[Last reply:4 months ago] 这是由于下载的 faster-whisper 模型文件损坏或不完整导致的。解决方案:手动下载并放置模型:从 HuggingFace 镜像站(如 hf-mirror.com)手动下载 faster-whisper-large-v3 模型。下载后,将整个模型文件夹(例如 models--Systran--faster-whisper-large-v3)放入软件根目录下的 models/ 文件夹中。确保...49.81* Posted at: 4 months ago -
#3039 能把中文视频变成英文视频吗...
💬 1[Last reply:4 months ago] 是的,pyVideoTrans 的核心功能就是将视频从一种语言(如中文)自动翻译并配音为另一种语言(如英文)。核心工作流程如下:语音识别:将中文视频中的语音转换为中文文本字幕。字幕翻译:将中文字幕翻译成英文。语音合成:根据翻译后的英文字幕,生成英文配音音频。音画对齐:将新生成的英文配音与原视频画面进行同步合成,最终输出一个完整的英文视频。关键配置建议:语音识别:推荐使用 faster-whispe...151.243* Posted at: 4 months ago -
#3038 怎么修改 pyVideoTrans 中 GPT-SoVITS 模块的源码,将其请求方式从 GET 改为 POST...
💬 3[Last reply:4 months ago] 根据终端日志显示,pyVideoTrans 向 GPT-SoVITS 服务发送的是 GET 请求,这不符合 GPT-SoVITS API 的标准调用方式(通常为 POST),导致服务虽然返回了 200 状态码,但可能未正确处理请求,因此没有生成声音。解决方案:确认 GPT-SoVITS API 版本:首先,请确认你部署的 GPT-SoVITS 项目版本及其 API 接口规范。最新的 GPT-SoV...240e:341* Posted at: 4 months ago -
#3032 把GPT-SoVITS接入pyVedioTrans后,选择训练好的音色,为字幕配音,生成的音频没有声音,下面是日志 Application started at 2026-02-01 19:57:22 [DEBUG] 返回缓存的编解码器 W......
💬 23[Last reply:4 months ago] 怎么修改 pyVideoTrans 中 GPT-SoVITS 模块的源码,将其请求方式从 GET 改为 POST...240e:341* Posted at: 4 months ago -
#3037 TaskCfg(cache_folder='D:/win-pyvideotrans-v3.95/tmp/16712/6ca601c7a5', target_dir='D:/剪映剪辑完/WHAT do they WANT from me! Chaotic first days entering CHINA on a motorbike. S01E36-mp4'...
💬 1[Last reply:4 months ago] 这是 pyVideoTrans v3.95 版本的一个已知 bug。解决方案:打开软件,进入菜单栏的“工具” -> “高级选项”。在“通用设置”选项卡中,找到“最大进程数”设置项。将数值修改为 2。如果你的电脑 CPU 核心数超过 16 核,可以尝试设置为 4 或 8。点击“保存”按钮,然后完全关闭并重启 pyVideoTrans 软件。请查阅相关文档:v3.95更新日志...203.10* Posted at: 4 months ago -
#3036 Connection failed: HTTPSConnectionPool(host='api-free.deepl.com', port=443): Max retries exceeded with url: /v2/translate (Caused by ProxyError('Unable to connect to proxy', NewCon...
💬 1[Last reply:4 months ago] 这是由于网络代理配置问题导致 DeepL 翻译 API 连接失败。检查网络代理设置:在 pyVideoTrans 菜单栏中,依次点击“设置”->“网络代理”。如果你使用了代理软件(如 Clash、V2Ray),请确保代理软件已开启,并将正确的代理地址(如 http://127.0.0.1:7890)和端口填入软件设置中。如果你没有使用代理,请确保“网络代理”选项是关闭状态。验证代理连接:配置...240e:380* Posted at: 4 months ago -
#3035 TaskCfg(cache_folder='D:/SPFY/tmp/4548/43ab6e5b18', target_dir='d:/spfy/output/tts', remove_noise=False, is_separate=False, detect_language=None, subtitle_language=None, source_lan...
💬 1[Last reply:4 months ago] 该错误是由于 pydub 库在读取音频文件时,文件路径或文件内容存在问题,导致返回了 None 对象,进而无法执行 seek 操作。解决方案:检查文件路径:确认任务配置中 target_wav='d:/spfy/output/tts/20260202-002224.wav' 指向的音频文件是否存在,以及路径是否包含中文字符或特殊符号(路径应避免使用中文和空格)。检查音频文件完整...188.253* Posted at: 4 months ago -
#3034 RuntimeError: File model.bin is incomplete: failed to read a buffer of size 9830400 at position 577685665...
💬 1[Last reply:4 months ago] 这是由于下载的 faster-whisper 模型文件损坏或不完整导致的。解决方案:手动下载模型:由于网络问题,自动从 HuggingFace 下载的模型文件可能损坏。放置到正确目录:从可靠的镜像站(如 modelscope.cn)下载 faster-whisper-large-v3 模型。将下载的模型文件夹(例如 models--Systran--faster-whisper-large-v3)...45.158* Posted at: 4 months ago -
#3033 TaskCfg(cache_folder='F:/EDITVIDEO/win-pyvideotrans-v3.96/tmp/6836/bb136dd262', target_dir='C:/Users/Son Bui/Videos/pyvideotrans/recogn/recogn', remove_noise=False, is_separate=Fal...
💬 1[Last reply:4 months ago] The error is caused by a missing or corrupted model.bin file for the faster-whisper-large-v3 model. The software cannot find the necessary model file in the specified directory.Solution Steps:Manually...117.1* Posted at: 4 months ago -
#3031 TaskCfg(cache_folder='F:/EDITVIDEO/win-pyvideotrans-v3.96/tmp/13104/11c1281577', target_dir='F:/EDITVIDEO/win-pyvideotrans-v3.96/output/recogn', remove_noise=False, is_separate=Fal...
💬 1[Last reply:4 months ago] The error is caused by a missing or corrupted model.bin file for the faster-whisper model in your local models directory.Solution:Manually download the model: Since the automatic download from Hugging...117.1* Posted at: 4 months ago -
#3030 RuntimeError: Connection was closed by the remote host. Error code: 1007. Error details: Unsupported voice None. USP state: TurnStarted. Received audio size: 0 bytes....
💬 1[Last reply:4 months ago] 这是由于在 Azure TTS 配音渠道中,未正确设置或选择了不支持的语音角色(voice)导致的。解决方案:检查并设置语音角色:在 pyVideoTrans 的“配音设置”中,确保已选择 Azure TTS 渠道,并在“角色”下拉列表中明确选择一个有效的语音名称(如 zh-CN-XiaoxiaoNeural),不能为空或 None。验证 Azure 资源配置:确认在 Azure TTS 配置中填...223.18* Posted at: 4 months ago
Open source and free maintenance is not easy. If this project is helpful to you, please consider making a small donation to help the project continue to maintain and update.
Dondate: ko-fi.com/jianchang512