-
#4363 一直卡在transcribe word_timestamps 不动...
💬 7[Last reply:1 month ago] 根据最新日志中的警告信息,进程正在尝试对断句结果进行修正,但出现了多进程日志写入冲突,这通常表明进程可能陷入了死锁或长时间等待状态。此问题与长视频计算断句的负载过高有关。请执行以下步骤:终止当前卡死的任务,确保软件进程已完全退出,并删除临时文件夹(软件目录下的 tmp 文件夹)内容,避免残留文件干扰下次运行。彻底关闭高级选项中的断句修正路径:依次进入 菜单 → 工具/选项 → 高级选项 → 语音识...2408:8262* Posted at: 1 month ago -
#4362 TaskCfgSTT(is_cuda=True, uuid='9947585d73', cache_folder='E:/APP/win-pyvideotrans-v3.99-428/tmp/15340/9947585d73', target_dir='E:/APP/win-pyvideotrans-v3.99-428/output/recogn', sou...
💬 1[Last reply:1 month ago] 这是由于 cuBLAS 库与当前显卡或 CUDA 版本不兼容导致的,常见于较新的 NVIDIA 显卡(如 RTX 50 系列)上使用 faster-whisper 时。解决方法:关闭 CUDA 加速:在主界面取消勾选 CUDA 加速,改用 CPU 进行语音识别(速度会变慢,但可正常完成)。手动修复 CUDA 兼容性:参考官方文档,设置环境变量 CUDA_MODULE_LOADING=LAZY 或更...2408:8262* Posted at: 1 month ago -
#4361 ImportError: cannot import name 'ir' from 'llvmlite' (unknown location)...
💬 1[Last reply:1 month ago] 这是预打包版的内置库文件损坏或缺失导致的,常见原因包括:下载不完整、解压路径含中文/空格、或杀毒软件误删文件。解决方案:完全删除当前 D:/videotrans 文件夹。前往 pyvideotrans.com/downpackage 重新下载 完整软件包(非补丁包)。将压缩包解压到 非系统盘、路径仅含英文和数字 的目录(如 D:\pyVideoTrans),切勿直接在压缩包内运行。解压前暂时关闭杀...39.149* Posted at: 1 month ago -
#4360 AttributeError: module 'llvmlite.binding' has no attribute 'get_host_cpu_name'...
💬 1[Last reply:1 month ago] 这是由于 Qwen-TTS 本地配音渠道依赖的 numba / llvmlite 库与当前 CPU 或打包环境不兼容所致。 解决步骤(按推荐顺序尝试):临时切换配音渠道:在主界面将“配音渠道”选为 Edge-TTS (免费),微软的免费接口,支持所有语言,无需额外配置,可立即绕过此错误。修复打包版本:此问题可能已在最新补丁包中解决。前往 补丁地址 下载 sp.exe,覆盖到软件根目录后重试。屏蔽...39.149* Posted at: 1 month ago -
#4359 opening output file /Users/nhu/Desktop/ProjectX/pyvideotrans/output/vas/nu-phu-1777573254.mp4. opening output files: Filter not found...
💬 5[Last reply:1 month ago] The same error persists, which suggests that the subtitles filter is still missing from the ffmpeg that pyVideoTrans actually uses. Please verify you have completed these steps and then check which ff...2001:ee0* Posted at: 1 month ago -
#4358 1M上下文384K最大输出token的LLM模型,AI翻译渠道每批字幕行数这个参数应该填多少行?如果开启了AI翻译附带完整字幕,可以填多少行...
💬 13[Last reply:1 month ago] 基于128k最大输出token,按每行双语字幕平均消耗约50 tokens估算,一次最多可输出约 2500 行双语字幕。若模型智能欠佳导致翻译冗余,实际行数会稍低。若仅输出单语字幕,行数会更高,约 3500 行。通常在几千行以内的字幕文件都是安全的;若你的字幕超过3000行,建议分批或提前查行数。如需进一步提升安全性,可将“AI翻译渠道每批字幕行数”设为字幕总行数或9999,并同时勾选“AI翻译附...36.232* Posted at: 1 month ago -
#4356 怎么没有保存背景音乐的选项了...
💬 3[Last reply:1 month ago] 问题已解决,如有其他疑问可随时提出。...124.228* Posted at: 1 month ago -
#4357 有配置文件能改deepseekapi的思考模式吗?现在默认思考有点费token...
💬 1[Last reply:1 month ago] 暂无关于修改DeepSeek API思考模式的直接配置文件。pyVideoTrans调用DeepSeek时默认使用标准对话模型,若您发现消耗token过多,可能是因为选择了推理增强模型(如DeepSeek-R1系列)。可尝试以下步骤减少token消耗:在翻译渠道设置中,将模型名称手动改为非推理模型,例如 deepseek-chat(而非 deepseek-reasoner 等深度思考版本)。在“菜...122.230* Posted at: 1 month ago -
#4355 TaskCfgVTT(is_cuda=True, uuid='dccc4dafa7', cache_folder='D:/win-pyvideotrans-v3.99-420/tmp/11596/dccc4dafa7', target_dir='H:/MID/_video_out/hhd800.com@h_1711devr00016.part1_8K-wav...
💬 1[Last reply:1 month ago] 这是由于CUDA环境或显卡驱动与当前faster-whisper模型不兼容导致的,具体表现为cuBLAS运算不支持。解决方案(按推荐顺序尝试):关闭CUDA加速(立即可行):在主界面取消勾选“CUDA加速”选项,然后重新执行语音识别。虽然速度会变慢,但可确保任务完成。更新显卡驱动和CUDA环境:确保已安装NVIDIA显卡驱动最新版。安装CUDA 12.8和cuDNN 9.11及以上版本(软件内置支...240e:39e* Posted at: 1 month ago -
#4353 TaskCfgSTS(is_cuda=False, uuid='220dccb85b', cache_folder=None, target_dir='E:/PH/krenz comp 16/cn LLM', source_language=None, source_language_code='Simplified Chinese', source_sub...
💬 1[Last reply:1 month ago] This error occurs because the local AI translation service (e.g., Ollama) disconnected unexpectedly while processing the request. The server closed the connection without sending a response.Solutions ...202.150* Posted at: 1 month ago -
#4349 中文配音后,会弹出单独的交互窗口,我可以试听配音,也可以重新配音...
💬 9[Last reply:1 month ago] 界面试听的破音问题源自 PySide6/Qt 多媒体后端与部分 Windows 音频驱动的兼容性缺陷,目前知识库与软件内并无专门参数可彻底修复该播放组件自身的解码倾向。可尝试以下低概率缓解方式(不保证解决):更新声卡驱动至最新版,尤其是 Realtek 或独立显卡的 HDMI 音频驱动。在 Windows 声音设置中临时将扬声器属性 → 高级 → 默认格式改为 16 位 44100 Hz(或 48...2409:8a55* Posted at: 1 month ago -
#4352 TaskCfg(cache_folder='D:/pyvideotrans/tmp/10148/fc44d302ac', target_dir='H:/新建文件夹 (2)', remove_noise=False, is_separate=False, detect_language=None, subtitle_language=None, source_...
💬 1[Last reply:1 month ago] 该错误是磁盘空间不足导致的,软件在合成音频时无法写入临时文件。原因:输出目录 H:/新建文件夹 (2) 所在磁盘(H盘)或软件临时文件夹 D:/pyvideotrans/tmp 所在磁盘(D盘)已无可用空间。解决方法:查看磁盘可用空间:检查 D 盘和 H 盘的剩余容量,删除不需要的文件或移动文件到其他位置,确保至少有数 GB 的可用空间。清理软件缓存:关闭软件,进入 D:/pyvideotrans...27.189* Posted at: 1 month ago -
#4351 自己下载的本地模型可以添加进来吗...
💬 5[Last reply:1 month ago] 断句粘连的常见原因是语音识别参数中“最长语音持续秒数”设置得过大,导致模型将多个句子当成长段输出,或者识别后没有进行有效分割。请在 菜单 → 工具/选项 → 高级选项 → 语音识别参数 中尝试以下调整(修改后立即生效):将 最长语音持续秒数 改为 5 或更小(如 3),强制在较长静音处分割。将 静音分割持续毫秒 改为 200,降低分割门槛,使短停顿时也切分句子。将 语音阈值 设为 0.5 左右,避...120.236* Posted at: 1 month ago -
#4345 有没有视频语音提取转文字...
💬 15[Last reply:1 month ago] 软件官方仅适配 CUDA 12.8 环境,在 CUDA 13.2 + cuDNN 9.2 组合下,默认的 float32 数据类型可能引发兼容性或显存压力,导致 GPU 加速失效。将 “CUDA 数据类型” 改为 float16 可以降低资源占用和部分兼容性要求,从而避开问题正常执行。建议保持此项设置为 float16 继续使用。若后续遇到其他 GPU 相关报错,推荐降级 CUDA 至 12.8 ...2a09:bac5* Posted at: 1 month ago -
#4350 TaskCfgSTT(is_cuda=True, uuid='7818646aeb', cache_folder='E:/win-pyvideotrans-v3.99-428/tmp/13252/7818646aeb', target_dir='E:/win-pyvideotrans-v3.99-428/output/recogn', source_lang...
💬 7[Last reply:1 month ago] 已确认问题根源在于 CUDA 加速与当前显卡或环境的兼容性,而非识别功能本身。若仍希望开启 CUDA 加速以提升速度,请按顺序尝试:先调整高级参数 打开 菜单 → 工具/选项 → 高级选项 → 语音识别参数,做以下修改:CUDA数据类型:改为 int8beam_size:设为 1best_of:设为 1 保存后重新勾选主界面的“CUDA 加速”,再次执行识别。验证 cuDNN 环境 确保 c...2a09:bac5* Posted at: 1 month ago -
#4348 TaskCfgSTT(is_cuda=True, uuid='3ffe60a02a', cache_folder='E:/win-pyvideotrans-v3.99-428/tmp/13252/3ffe60a02a', target_dir='E:/win-pyvideotrans-v3.99-428/output/recogn', source_lang...
💬 1[Last reply:1 month ago] 该错误是因为 cuBLAS(CUDA基础线性代数库)返回了 CUBLAS_STATUS_NOT_SUPPORTED,通常发生在 RTX 50 系列或其他新架构显卡上,当前 faster-whisper 版本尚不完全兼容。解决方案(按推荐顺序尝试)关闭 CUDA 加速 在主界面取消勾选“CUDA加速”选项,然后重新开始任务。此时将使用 CPU 进行处理,速度较慢但能避免该错误。调整 CUDA 数据...2a09:bac5* Posted at: 1 month ago -
#4347 AttributeError: module 'decoders' has no attribute 'DecodeStream'...
💬 1[Last reply:1 month ago] 该错误是 Python 环境中的 tokenizers 库版本不兼容导致的,通常发生在使用旧版补丁覆盖或打包文件不完整的情况下。请按以下顺序排查:重新下载完整包:前往官网下载最新的 v3.99 完整软件包(不要只下载升级补丁),将其解压到一个全新、路径不含中文和特殊符号的文件夹(例如 D:\pyVideoTrans),然后双击 sp.exe 运行。检查运行环境:确保已经安装了 微软 VC++ 运行...218.173* Posted at: 1 month ago -
#4346 如何进行视频里多角色翻译和配音?...
💬 1[Last reply:1 month ago] 实现多角色翻译和配音,核心需要启用“说话人分离”并为不同说话人分配不同的配音角色。以下是操作步骤:在主界面勾选“识别说话人”(位于“设置更多参数…”区域),根据视频中说话人数预估一个数值,不限制时软件自动判断。选择语音识别渠道(如 faster-whisper)并设定好模型,开始执行语音识别,识别结束后会弹出字幕编辑窗口。在字幕编辑窗口中,每一条字幕可指定其对应的说话人(软件会自动预分配,但建议手...140.245* Posted at: 1 month ago -
#4344 怎么把下载的模型删除掉...
💬 1[Last reply:1 month ago] 这是因为模型文件都保存在软件安装目录下的 models 文件夹内,直接删除对应的模型子文件夹即可。操作步骤:进入 pyVideoTrans 的安装目录(即 sp.exe 或 sp.py 所在位置)。打开 models 文件夹。找到你不想要的模型文件夹,例如:models--Systran--faster-whisper-large-v3 (对应 large-v3 模型)models--Systra...36.230* Posted at: 1 month ago -
#4343 比如3DS,配音是“3毫秒”,我想发单个字母的声音,还有就是让所有大写的单个字母都发字母音,需要怎么设置,或者有提示词设置吗...
💬 1[Last reply:1 month ago] 这是由于 TTS 引擎对缩写/大写字母组合的发音处理方式导致的,pyVideoTrans 本身不提供拼读字母的自动转换开关。需要从字幕文本层面手动干预。解决方案:在字幕处理阶段修改文本:在语音识别和翻译完成后,人工检查字幕文件(SRT),将需要拼读的大写字母组合(如 3DS)手动替换为带空格的单个字符形式“3 D S”。这样 TTS 引擎会逐个读出字母发音。批量替换:如果有大量类似缩写,可使用字幕...2409:8a55* Posted at: 1 month ago
Open source and free maintenance is not easy. If this project is helpful to you, please consider making a small donation to help the project continue to maintain and update.
Dondate: ko-fi.com/jianchang512