-
#4351 自己下载的本地模型可以添加进来吗...
💬 5[Last reply:1 month ago] 断句粘连的常见原因是语音识别参数中“最长语音持续秒数”设置得过大,导致模型将多个句子当成长段输出,或者识别后没有进行有效分割。请在 菜单 → 工具/选项 → 高级选项 → 语音识别参数 中尝试以下调整(修改后立即生效):将 最长语音持续秒数 改为 5 或更小(如 3),强制在较长静音处分割。将 静音分割持续毫秒 改为 200,降低分割门槛,使短停顿时也切分句子。将 语音阈值 设为 0.5 左右,避...120.236* Posted at: 1 month ago -
#4345 有没有视频语音提取转文字...
💬 15[Last reply:1 month ago] 软件官方仅适配 CUDA 12.8 环境,在 CUDA 13.2 + cuDNN 9.2 组合下,默认的 float32 数据类型可能引发兼容性或显存压力,导致 GPU 加速失效。将 “CUDA 数据类型” 改为 float16 可以降低资源占用和部分兼容性要求,从而避开问题正常执行。建议保持此项设置为 float16 继续使用。若后续遇到其他 GPU 相关报错,推荐降级 CUDA 至 12.8 ...2a09:bac5* Posted at: 1 month ago -
#4350 TaskCfgSTT(is_cuda=True, uuid='7818646aeb', cache_folder='E:/win-pyvideotrans-v3.99-428/tmp/13252/7818646aeb', target_dir='E:/win-pyvideotrans-v3.99-428/output/recogn', source_lang...
💬 7[Last reply:1 month ago] 已确认问题根源在于 CUDA 加速与当前显卡或环境的兼容性,而非识别功能本身。若仍希望开启 CUDA 加速以提升速度,请按顺序尝试:先调整高级参数 打开 菜单 → 工具/选项 → 高级选项 → 语音识别参数,做以下修改:CUDA数据类型:改为 int8beam_size:设为 1best_of:设为 1 保存后重新勾选主界面的“CUDA 加速”,再次执行识别。验证 cuDNN 环境 确保 c...2a09:bac5* Posted at: 1 month ago -
#4348 TaskCfgSTT(is_cuda=True, uuid='3ffe60a02a', cache_folder='E:/win-pyvideotrans-v3.99-428/tmp/13252/3ffe60a02a', target_dir='E:/win-pyvideotrans-v3.99-428/output/recogn', source_lang...
💬 1[Last reply:1 month ago] 该错误是因为 cuBLAS(CUDA基础线性代数库)返回了 CUBLAS_STATUS_NOT_SUPPORTED,通常发生在 RTX 50 系列或其他新架构显卡上,当前 faster-whisper 版本尚不完全兼容。解决方案(按推荐顺序尝试)关闭 CUDA 加速 在主界面取消勾选“CUDA加速”选项,然后重新开始任务。此时将使用 CPU 进行处理,速度较慢但能避免该错误。调整 CUDA 数据...2a09:bac5* Posted at: 1 month ago -
#4347 AttributeError: module 'decoders' has no attribute 'DecodeStream'...
💬 1[Last reply:1 month ago] 该错误是 Python 环境中的 tokenizers 库版本不兼容导致的,通常发生在使用旧版补丁覆盖或打包文件不完整的情况下。请按以下顺序排查:重新下载完整包:前往官网下载最新的 v3.99 完整软件包(不要只下载升级补丁),将其解压到一个全新、路径不含中文和特殊符号的文件夹(例如 D:\pyVideoTrans),然后双击 sp.exe 运行。检查运行环境:确保已经安装了 微软 VC++ 运行...218.173* Posted at: 1 month ago -
#4346 如何进行视频里多角色翻译和配音?...
💬 1[Last reply:1 month ago] 实现多角色翻译和配音,核心需要启用“说话人分离”并为不同说话人分配不同的配音角色。以下是操作步骤:在主界面勾选“识别说话人”(位于“设置更多参数…”区域),根据视频中说话人数预估一个数值,不限制时软件自动判断。选择语音识别渠道(如 faster-whisper)并设定好模型,开始执行语音识别,识别结束后会弹出字幕编辑窗口。在字幕编辑窗口中,每一条字幕可指定其对应的说话人(软件会自动预分配,但建议手...140.245* Posted at: 1 month ago -
#4344 怎么把下载的模型删除掉...
💬 1[Last reply:1 month ago] 这是因为模型文件都保存在软件安装目录下的 models 文件夹内,直接删除对应的模型子文件夹即可。操作步骤:进入 pyVideoTrans 的安装目录(即 sp.exe 或 sp.py 所在位置)。打开 models 文件夹。找到你不想要的模型文件夹,例如:models--Systran--faster-whisper-large-v3 (对应 large-v3 模型)models--Systra...36.230* Posted at: 1 month ago -
#4343 比如3DS,配音是“3毫秒”,我想发单个字母的声音,还有就是让所有大写的单个字母都发字母音,需要怎么设置,或者有提示词设置吗...
💬 1[Last reply:1 month ago] 这是由于 TTS 引擎对缩写/大写字母组合的发音处理方式导致的,pyVideoTrans 本身不提供拼读字母的自动转换开关。需要从字幕文本层面手动干预。解决方案:在字幕处理阶段修改文本:在语音识别和翻译完成后,人工检查字幕文件(SRT),将需要拼读的大写字母组合(如 3DS)手动替换为带空格的单个字符形式“3 D S”。这样 TTS 引擎会逐个读出字母发音。批量替换:如果有大量类似缩写,可使用字幕...2409:8a55* Posted at: 1 month ago -
#4342 音频比视频要慢了大概10秒左右,要怎么处理?...
💬 1[Last reply:1 month ago] 音频比视频慢了约10秒,是由于翻译后的配音时长与原始语音时长不一致导致的。处理步骤如下:开启对齐选项:在主界面勾选 配音加速 和/或 视频慢速,强制使配音与原视频时长匹配。开启二次识别:勾选 二次识别,软件会在配音完成后再次对配音音频进行语音识别,生成精准匹配配音的字幕,确保字幕与声音对齐。调整配音速度:如果仅慢10秒,可尝试在 配音语速 中设置一个正值(如 10 或 15),整体加速配音。精细控...218.173* Posted at: 1 month ago -
#4341 FileNotFoundError: [WinError 206] 文件名或扩展名太长。: 'C:\\Users\\hasee\\Downloads\\_video_out\\2 X 上的 Filecoin:“Cardano s @IOHK_Charles and @FilFoundation President @MartaBelcher chat abo...
💬 1[Last reply:1 month ago] 原因是 Windows 系统对文件路径有最大长度限制(通常为 260 个字符),你的原视频文件名太长,导致自动生成的输出目录完整路径超出了系统限制。解决方法:将原视频文件移动到一个浅层目录(如 D:\videos),并将视频重命名为简短英文或数字名称(例如 video1.mp4)。避免文件名中含中文、特殊符号或过长字符。在软件主界面点击“输出到..”按钮,将输出目录设置为一个同样较浅且无特殊符号的...64.186* Posted at: 1 month ago -
#4283 术语表是不是区分大小写的?...
💬 18[Last reply:1 month ago] 要实现“忽略术语原词大小写,仅匹配字母序列”这一规则,你需要直接在所使用的翻译渠道的 提示词 中添加明确指令。以下是具体的操作步骤和示例:1. 确定要修改的提示词文件位置如果你勾选了【发送完整字幕】,需要修改:[软件目录]/videotrans/prompts/srt/deepseek.txt (如果使用其他渠道,请选择对应文件)如果未勾选,需要修改:[软件目录]/videotrans/promp...2409:8a55* Posted at: 1 month ago -
#4339 videotrans.configure._except.StopRetry: No Ref Audio. Clone disabled....
💬 1[Last reply:1 month ago] This error occurs because the audio cloning feature is enabled (a clone voice role is selected) but no valid reference audio is found or the extracted speech segments are outside the required duration...191.6* Posted at: 1 month ago -
#4338 whisper语音识别问题...
💬 17[Last reply:1 month ago] 软件中 DeepSeek 作为翻译渠道时,模型名称需要手动输入,而非在下拉菜单直接选择。目前知识库未提供 DeepSeek 官方支持的全部模型列表,但常见的可用模型包括:deepseek-chat(即 DeepSeek-V3 最新对话模型)deepseek-reasoner(即 DeepSeek-R1 推理模型,适合复杂逻辑)deepseek-v3-flash 等不同后缀版本(视官方公告)在软件中...112.22* Posted at: 1 month ago -
#4334 工具/选项中的“实时语音转文字”功能时报错...
💬 9[Last reply:1 month ago] 根据您提供的日志,pyVideoTrans v3.99-428 启动正常,已检测到 GPU。但“实时语音转文字”功能所需的 tools 文件夹确实缺失,这属于该版本可能的打包遗漏。 目前日志中没有记录到任何错误,因此无法直接定位。请按以下步骤尝试解决:卸载当前版本:完全删除 G:\pyVideoTrans 目录。临时降级:前往 pyvideotrans.com/downpackage 下载 v3...107.173.15.138,107.173* Posted at: 1 month ago -
#4337 win-pyvideotrans-v3.99-428执行后没生成.mp4文件...
💬 3[Last reply:1 month ago] WebM 格式(通常 VP8/VP9 编码)与 FFmpeg 硬件加速的兼容性较差,即使勾选输出为 MP4,合成阶段也容易因解码器或滤镜链冲突卡死。解决方案(按推荐顺序):禁用硬件解码/编码 打开 菜单 → 工具/选项 → 高级选项:取消勾选 视频合成cuda硬解码取消勾选 主界面 CUDA加速(如果仍在勾选状态) 然后重新翻译同一视频。这样会自动转用纯 CPU 软编解码,虽慢但能稳定处理 W...2a09:bac1* Posted at: 1 month ago -
#4336 concurrent.futures._base.CancelledError...
💬 1[Last reply:1 month ago] 这是 F5-TTS 配音服务连接或响应异常导致的 CancelledError,通常表示 API 请求被中断或超时。解决方案:检查 F5-TTS 服务是否正在运行,命令行窗口是否被关闭。确认软件中的 API 地址设置正确(默认 http://127.0.0.1:7860),端口没有被其他程序占用。确保参考音频文件放在 软件目录/f5-tts 文件夹内,且时长在 3-10 秒之间。在菜单 “工具/选...240e:399* Posted at: 1 month ago -
#4335 requests.exceptions.ProxyError: HTTPSConnectionPool(host='translate.google.com', port=443): Max retries exceeded with url: /m?sl=zh-cn&tl=en&hl=en&q=%E4%BD%A0%E6%83%B3%E6%80%8E%E4%...
💬 1[Last reply:1 month ago] 错误信息明确指向 Google翻译 因代理不可达导致的连接失败。你的软件中启用了网络代理,但该代理地址无效或被拒绝连接。解决方案(二选一):方案一:关闭代理(推荐,如果你在国内无可用代理)在主界面网络代理地址文本框中,删除已填写的所有内容,保持完全空白。将翻译渠道更换为无需代理的服务,例如:微软翻译、百度翻译、腾讯翻译(免费或需自行获取API Key)。DeepLX(需自行部署,但部署后无需代理)...156.226* Posted at: 1 month ago -
#4333 在哪能够看到小版本升级的内容...
💬 2[Last reply:1 month ago] 未作记录,有需要直接查看 github 上的简要 commit 日志...103.172* Posted at: 1 month ago -
#4331 如何将这台电脑的pyvideotrans配置完整的移到另一电脑当中的pyvideotrans中...
💬 1[Last reply:1 month ago] 这是通过直接复制软件目录实现的,因为 pyVideoTrans 是绿色免安装软件,不依赖注册表。操作步骤如下:确认旧电脑环境:记下旧电脑上 pyVideoTrans 的解压路径(例如 D:\pyVideoTrans)。复制核心目录:将整个 pyVideoTrans 的根目录文件夹复制到新电脑的同一盘符下(推荐放在非系统盘的根目录,如 D:\pyVideoTrans)。注意:如果 tmp 文件夹体积...2409:8a55* Posted at: 1 month ago -
#4330 翻译使用deepseek可以支持deepseekv4pro了吗?...
💬 2[Last reply:1 month ago] 菜单 翻译设置 deepseek界面,文本框内自己添加 deepseek-v4-pro 模型,选中使用就行...5.34* Posted at: 1 month ago
Open source and free maintenance is not easy. If this project is helpful to you, please consider making a small donation to help the project continue to maintain and update.