• #1724 字幕提取...
    💬 1
    [Last reply:26 days ago] pyVideoTrans 支持多种字幕格式的提取和生成,主要通过其“工具箱”功能实现。1. 提取字幕(语音转字幕)功能位置:主界面 -> 工具箱 -> 批量语音转字幕。操作:导入视频或音频文件,选择语音识别模型(如 faster-whisper),设置输出格式(SRT/TXT),点击“开始识别”即可提取字幕...
    64.32* Posted at: 26 days ago
  • #1723 HTTPConnectionPool(host='127.0.0.1', port=9988): Max retries exceeded with url: /apitts (Caused by NewConnectionError('<...
    💬 1
    [Last reply:26 days ago] 这个错误表明软件尝试连接本地端口 9988 的 TTS 服务(如 GPT-SoVITS、CosyVoice 等)时失败,因为该服务没有启动或端口不正确。核心原因: 您选择了需要本地部署的配音角色(如“Clone”角色或 GPT-SoVITS),但对应的本地 TTS 服务程序没有运行。解决方法:确认您选择的配音角色:在主...
    45.146* Posted at: 26 days ago
  • #1722 videotrans.configure._except.StopRetry: [WinError 10049] 在其上下文中,该请求的地址无效。...
    💬 1
    [Last reply:26 days ago] 此错误表明软件在尝试连接 F5-TTS 语音合成服务时,无法解析或访问您提供的服务器地址。错误 [WinError 10049] 在其上下文中,该请求的地址无效 通常意味着网络地址格式错误或无法访问。请按以下步骤排查:检查 F5-TTS 服务地址:如果您使用的是本地部署的 F5-TTS,请确认服务已启动,并且地址(例如...
    2409:8a02* Posted at: 26 days ago
  • #1666 我用的本地配音gpt-sovits 配音速度慢要调哪些参数可以加速配音...
    💬 5
    [Last reply:26 days ago] 对于 11GB 显存,建议将“同时配音字幕数”设置为 3 或 4。这是兼顾速度和稳定性的最佳范围。具体分析如下:设置为 3:这是最稳妥的起点。它能提供比默认值(1)快约2-3倍的配音速度,同时为 GPT-SoVITS 模型和可能的其他任务(如语音识别)预留充足的显存余量,稳定性最高。设置为 4:如果您在设置为 3 后运...
    60.7* Posted at: 29 days ago
  • #1721 请问这是什么意思呢?...
    💬 1
    [Last reply:26 days ago] 这个错误提示表明软件在尝试从 Hugging Face 下载模型文件时,网络连接失败。核心原因与解决方案:网络连接问题(最常见):您的网络无法直接访问 Hugging Face 服务器。解决方案:为软件配置网络代理。在主界面第5行的 网络代理 输入框中,填入您的代理地址,格式如 http://127.0.0.1:789...
    43.246* Posted at: 26 days ago
  • #1720 语音识别多音字怎么处理...
    💬 5
    [Last reply:26 days ago] 您遇到了核心矛盾:修正了配音的读音,但导致字幕文本与视频原意不符。pyVideoTrans 目前没有内置的“多音字词典”来解决此问题,但可以通过以下两种方法实现字幕正确且配音读音也正确的目标。方案一:使用“字幕多角色配音”工具(推荐,可精确控制)此工具允许您为同一行字幕准备两个版本:一个用于显示(正确字幕),一个用于配...
    38.90* Posted at: 26 days ago
  • #126 module 'videotrans.util.help_ffmpeg' has no attribute 'set_process'...
    💬 11
    [Last reply:26 days ago] 不,这个提示词(Prompt)不用于 Google 翻译渠道。核心区别:AI 模型翻译(如 OpenAI、DeepSeek、Claude、Gemini 等):软件会发送包含时间戳和原文的完整字幕块,并附带上述的 Prompt 指令,要求模型在保持时间戳和顺序的前提下进行翻译。传统 API 翻译(如 Google、微软、...
    218.16* Posted at: 4 months ago
  • #1719 TaskCfg(cache_folder='H:/win-pyvideotrans-v3.86/tmp12556/41e8d921f4', target_dir='H:/xiazai/_video_out/test', remove_noi...
    💬 1
    [Last reply:26 days ago] 这是阿里FunASR本地语音识别模块在处理返回数据时出现的错误,缺少必需的 'sentence_info' 键。这通常是由于FunASR模型文件损坏、下载不完整或版本不匹配导致的。请按以下步骤解决:清理并重新下载模型:前往软件根目录下的 models 文件夹(例如 H:/win-pyvideotra...
    60.7* Posted at: 26 days ago
  • #1718 TaskCfg(cache_folder='H:/win-pyvideotrans-v3.86/tmp12556/3a64a10e6b', target_dir='H:/xiazai/_video_out/2025-12-02 06-10-...
    💬 3
    [Last reply:26 days ago] 此问题表明阿里FunASR模型下载或初始化失败,导致返回的数据结构不符合预期。请按以下步骤彻底排查:检查网络与代理:由于需要从HuggingFace下载模型,请确保您的网络可以正常访问 https://huggingface.co。如果无法直接访问,您需要在软件主界面第5行的“网络代理”中填写有效的代理地址(格式如 h...
    60.7* Posted at: 26 days ago
  • #1717 运行了26000s,程序运行阿里funASR时候卡在”模型加载完毕,进入识别“阶段了...
    💬 3
    [Last reply:26 days ago] 根据您提供的日志片段,问题已明确:程序卡在从 ModelScope 下载阿里 FunASR 模型文件的过程中。这不是识别阶段的问题,而是模型下载网络超时或中断导致的。由于模型文件较大,网络不稳定时极易发生。请按以下步骤解决:手动下载模型(推荐,最可靠):日志显示下载目录为:H:/win-pyvideotrans-v3....
    60.7* Posted at: 26 days ago
  • #1716 TaskCfg(cache_folder='D:/PC_AI/win-pyvideotrans-v3.86/tmp20860/12aacbf75b', target_dir='D:/PC_UE/DATA/GAS Crash Course/7...
    💬 1
    [Last reply:26 days ago] 合并阶段出错的核心原因是 输出文件路径过长或包含空格/特殊字符,导致 ffmpeg 无法创建文件。从错误信息 opening output files: No such file or directory 和您的文件路径 D:/PC_UE/DATA/GAS Crash Course/7 - Player Control...
    117.173* Posted at: 26 days ago
  • #1715 TaskCfg(cache_folder='E:/pytran/tmp10384/79b0be5b6a', target_dir='E:/视频下载/输出/Tree Pins Woman in Bed 😨', remove_noise=Fal...
    💬 1
    [Last reply:26 days ago] 错误核心是输出文件路径问题。从日志 opening output files: No such file or directory 和路径 E:/视频下载/输出/Tree Pins Woman in Bed 😨/Tree Pins Woman in Bed 😨.mp4 来看,问题出在输出文件夹不存在或路径包含特殊字符/...
    220.200* Posted at: 26 days ago
  • #1713 index 1218 is out of bounds for dimension 0 with size 1218...
    💬 5
    [Last reply:26 days ago] 这是 FunASR 模型加载后,在识别阶段卡住或无响应的典型问题。通常与模型处理长音频时的内存、配置或特定文件有关。请按以下步骤排查和解决:强制终止并重启软件:首先,通过任务管理器彻底结束 pyVideoTrans 进程。然后重新启动软件。使用 faster-whisper 引擎(推荐方案):这是最稳定、最快速的解决方...
    60.7* Posted at: 27 days ago
  • #1714 index 717 is out of bounds for dimension 0 with size 717...
    💬 1
    [Last reply:27 days ago] 这个错误 index 717 is out of bounds for dimension 0 with size 717 通常发生在使用 Faster-Whisper 进行语音识别时,模型加载或处理音频数据时出现了索引越界问题。结合您使用的是 Windows 预打包版 (v3.86),可以按以下步骤排查和解决:检查并...
    60.7* Posted at: 27 days ago
  • #1712 TaskCfg(cache_folder='H:/win-PatchUpdate-v3.86/tmp10352/speech2text', target_dir='h:/xiazai/out/recogn', remove_noise=Fa...
    💬 1
    [Last reply:27 days ago] 这是一个 FunASR 语音识别模型在处理特定音频时出现的内部索引越界错误。这通常与音频文件本身或模型在处理长音频时的缓存机制有关。请按以下步骤尝试解决:切换识别模型:这是最直接的解决方法。在主界面第2行“语音识别”中,将模型从“阿里FunASR中文(本地)”更换为“faster-whisper(本地)”,并选择一个合...
    60.7* Posted at: 27 days ago
  • #1711 list index out of range...
    💬 1
    [Last reply:27 days ago] 这个错误通常发生在处理视频时,软件无法正确解析视频的音频流或字幕流信息。请按以下步骤排查:检查视频文件:确认您要处理的视频文件本身是完整、可播放的,并且包含有效的音频轨道。简化文件路径和名称:将视频文件移动到简单的英文路径下(例如 D:/video.mp4),并确保文件名不含中文、空格或特殊符号。在软件中操作:在主界面...
    60.7* Posted at: 27 days ago
  • #1710 TaskCfg(cache_folder='E:/pyvideotrans-v3.86/tmp4696/speech2text', target_dir='e:/pyvideotrans-v3.86/output/recogn', remo...
    💬 1
    [Last reply:27 days ago] 错误信息显示您请求使用 float16 数据类型进行计算,但您的设备或后端不支持高效的 float16 计算。这通常发生在较旧的显卡或不支持半精度浮点运算的硬件上。解决方案:关闭 CUDA 加速(临时解决):在主界面第 6 行,取消勾选“CUDA加速”。这将强制软件使用 CPU 进行识别,虽然速度较慢,但可以绕过显卡的...
    240e:b8f* Posted at: 27 days ago
  • #1708 [Errno 2] No such file or directory: 'D:/Download/ZBrush/_video_out/022 /en.srt'...
    💬 1
    [Last reply:27 days ago] 这个错误表明软件在尝试读取或写入字幕文件时,文件路径中包含了空格,导致系统无法正确识别。核心原因: 您的视频文件所在路径 D:/Download/ZBrush/022 / 的文件夹名 022 末尾有一个空格。软件在处理时,这个空格被错误地包含在了输出路径中,导致系统找不到文件。解决方法:重命名文件夹(推荐): 将文件...
    45.95* Posted at: 27 days ago
  • #1707 请求频繁触发429,请调大暂停时间: Error code: 429 - [{'error': {'code': 429, 'message': 'You exceeded your current quota, please check ...
    💬 1
    [Last reply:27 days ago] 错误信息明确指出您的 Gemini API 配额已用尽或被限制(You exceeded your current quota),这与请求频率(429)相关,但核心是配额问题,仅调整暂停时间可能无效。请按以下步骤排查和解决:检查 API 配额与账单:登录您的 Google AI Studio 或 Google Clou...
    2602:feda* Posted at: 27 days ago
  • #1706 什么是SRT字幕?...
    💬 1
    [Last reply:27 days ago] SRT字幕是一种纯文本格式的字幕文件,用于在视频播放时显示同步的文字内容。它的特点是结构简单,由“序号”、“时间轴”和“字幕文本”三部分组成,例如:1 00:00:01,000 --> 00:00:04,000 你好,欢迎观看这个视频。 2 00:00:05,000 --> 00:00:08,000 今天...
    185.22* Posted at: 27 days ago
Open source and free maintenance is not easy. If this project is helpful to you, please consider making a small donation to help the project continue to maintain and update.

Related resource

Trending Questions