-
#4371 Warning: flash-attn is not installed. Will only run the manual PyTorch version. Please install flash-attn for faster inf......
💬 5[Last reply:1 month ago] flash-attn 警告是因为此库依赖 CUDA,在 macOS 上几乎无法正常安装(无 NVIDIA GPU 时也不会生效),可以安全忽略,不会阻止程序运行。sox: command not found 则是缺少音频工具,必须安装。解决步骤:安装 SoX:brew install sox忽略 Flash Attention 警告,或在虚拟环境中尝试安装(大概率失败):使用项目自带的 uv 环境...51.75* Posted at: 1 month ago -
#4370 TaskCfgTTS(is_cuda=False, uuid='66c21c82f1', cache_folder='/Users/junyouchen/Desktop/pyvideotrans/tmp/66102/66c21c82f1', target_dir='/Users/junyouchen/Downloads', source_language=N...
💬 1[Last reply:1 month ago] 这是由于未安装 qwen_tts 模块所致,Qwen3-TTS(本地) 渠道需要该第三方库。解决方案:在终端中进入软件源码目录 /Users/junyouchen/Desktop/pyvideotrans;使用 uv 添加依赖:uv add qwen_tts或使用 pip 安装(不推荐,可能干扰 uv 环境):uv run pip install qwen_tts安装完成后重新启动软件(uv ru...119.39* Posted at: 1 month ago -
#4369 为pyVideoTrans配置cuda环境一定要安装12.8版本吗?目前最新的cudatoolkit已经更新到13.2了,是否安装最新版本更好?还是必须安装12.8这一特定版本...
💬 3[Last reply:1 month ago] 是的,可以安装最新版 cuDNN(例如 9.21),只要版本 ≥ 9.11 即满足要求。 安装时请务必下载 针对 CUDA 12.8 编译的 cuDNN 版本(NVIDIA 官网会提供对应选项),否则可能出现库不匹配。 安装后同样需将文件复制到 CUDA 12.8 的 bin、include、lib 目录。请查阅相关文档:Windows 上安装 CUDA 12.8 和 cuDNN 9.11已安...103.3* Posted at: 1 month ago -
#4368 恢复标点能否不要恢复半句话的标点,也就是存在断句错误的句子,一句完整的话被强行切割到两条不同的字幕中,这种情况下,前半句一般会出现在字幕的末尾,这种不要加标点...
💬 1[Last reply:1 month ago] 暂无法确定具体原因。恢复标点功能在内部逻辑上尚未提供针对“断句错误”场景的半句区分能力,知识库中亦无相关配置参数可供调整。建议提供您使用的软件版本、原始字幕片段示例以及期望的处理行为,以便开发者评估优化。若需立即解决,可尝试以下临时替代方案:取消勾选“恢复标点”,使用更准确的语音识别模型(如 large-v3)以减少断句错误。在翻译/合成前,手动编辑识别出的 SRT 字幕,将明显被错切的句子合并并...2409:8a55* Posted at: 1 month ago -
#4367 Traceback (most recent call last):File "/Users/junyouchen/Desktop! pyvideotrans/.venv/lib/python3.10/site-packages/sound......
💬 1[Last reply:1 month ago] 这是因为系统中缺少 libsndfile 音频处理库导致 Python 的 soundfile 模块无法加载。解决方案:打开终端,使用 Homebrew 安装 libsndfile:brew install libsndfile若尚未安装 FFmpeg(软件必需),也一并安装:brew install ffmpeg安装完成后,重新运行软件。请注意:macOS 上源码部署还需确保 Python 3....51.75* Posted at: 1 month ago -
#4366 ValueError: The elements of the batch contain different keys. Cannot batch them ({'is_last', 'input_features', 'attention_mask'} != {'num_frames', 'is_last', 'input_features', 'att...
💬 1[Last reply:1 month ago] 这是由于音频片段长度不一致导致 transformers 管道批处理时特征键不匹配(input_features 形状不同)。解决方案:在菜单栏 工具/选项 → 高级选项 → 语音识别参数 中,勾选 “Whisper预分割音频”,强制模型逐句处理,避免不统一长度的片段混合批处理。将 “最长语音持续秒数” 设为较小的值(如 6 秒),避免生成极长片段;“最短语音持续毫秒” 设为 1000ms 以上,...2408:8262* Posted at: 1 month ago -
#4365 TaskCfgVTT(is_cuda=True, uuid='7fe7d62dc3', cache_folder='D:/AI/pyvideotrans/tmp/167832/7fe7d62dc3', target_dir='D:/AI/pyvideotrans/video goc/_video_out/videoplayback-mp4', source_...
💬 1[Last reply:1 month ago] This error is caused by an incompatibility between the cuBLAS library and your NVIDIA graphics card, most commonly seen on RTX 50-series GPUs or when a mixed CUDA/cuDNN version is used.Check your CUDA...14.179* Posted at: 1 month ago -
#4364 为字幕配音,拖入srt文件字幕配好音后,点击播放配音,为什么带着字幕里时间序号一起播放念啊?如何设置为字幕配音只让他念内容不念字幕里的时间序号?...
💬 1[Last reply:1 month ago] 这是因为软件未能正确解析 SRT 字幕文件,将序号和时间轴也当作了待配音的文本,导致 TTS 朗读了这些内容。通常是由于你使用的软件版本存在该 bug,或导入的不是标准 SRT 但软件未能过滤。解决方法:更新主程序:下载最新的 sp.exe 补丁文件覆盖到安装目录(v3.99 已修复相关 bug)。 下载地址:https://github.com/jianchang512/stt/release...121.27* Posted at: 1 month ago -
#4363 一直卡在transcribe word_timestamps 不动...
💬 7[Last reply:1 month ago] 根据最新日志中的警告信息,进程正在尝试对断句结果进行修正,但出现了多进程日志写入冲突,这通常表明进程可能陷入了死锁或长时间等待状态。此问题与长视频计算断句的负载过高有关。请执行以下步骤:终止当前卡死的任务,确保软件进程已完全退出,并删除临时文件夹(软件目录下的 tmp 文件夹)内容,避免残留文件干扰下次运行。彻底关闭高级选项中的断句修正路径:依次进入 菜单 → 工具/选项 → 高级选项 → 语音识...2408:8262* Posted at: 1 month ago -
#4362 TaskCfgSTT(is_cuda=True, uuid='9947585d73', cache_folder='E:/APP/win-pyvideotrans-v3.99-428/tmp/15340/9947585d73', target_dir='E:/APP/win-pyvideotrans-v3.99-428/output/recogn', sou...
💬 1[Last reply:1 month ago] 这是由于 cuBLAS 库与当前显卡或 CUDA 版本不兼容导致的,常见于较新的 NVIDIA 显卡(如 RTX 50 系列)上使用 faster-whisper 时。解决方法:关闭 CUDA 加速:在主界面取消勾选 CUDA 加速,改用 CPU 进行语音识别(速度会变慢,但可正常完成)。手动修复 CUDA 兼容性:参考官方文档,设置环境变量 CUDA_MODULE_LOADING=LAZY 或更...2408:8262* Posted at: 1 month ago -
#4361 ImportError: cannot import name 'ir' from 'llvmlite' (unknown location)...
💬 1[Last reply:1 month ago] 这是预打包版的内置库文件损坏或缺失导致的,常见原因包括:下载不完整、解压路径含中文/空格、或杀毒软件误删文件。解决方案:完全删除当前 D:/videotrans 文件夹。前往 pyvideotrans.com/downpackage 重新下载 完整软件包(非补丁包)。将压缩包解压到 非系统盘、路径仅含英文和数字 的目录(如 D:\pyVideoTrans),切勿直接在压缩包内运行。解压前暂时关闭杀...39.149* Posted at: 1 month ago -
#4360 AttributeError: module 'llvmlite.binding' has no attribute 'get_host_cpu_name'...
💬 1[Last reply:1 month ago] 这是由于 Qwen-TTS 本地配音渠道依赖的 numba / llvmlite 库与当前 CPU 或打包环境不兼容所致。 解决步骤(按推荐顺序尝试):临时切换配音渠道:在主界面将“配音渠道”选为 Edge-TTS (免费),微软的免费接口,支持所有语言,无需额外配置,可立即绕过此错误。修复打包版本:此问题可能已在最新补丁包中解决。前往 补丁地址 下载 sp.exe,覆盖到软件根目录后重试。屏蔽...39.149* Posted at: 1 month ago -
#4359 opening output file /Users/nhu/Desktop/ProjectX/pyvideotrans/output/vas/nu-phu-1777573254.mp4. opening output files: Filter not found...
💬 5[Last reply:1 month ago] The same error persists, which suggests that the subtitles filter is still missing from the ffmpeg that pyVideoTrans actually uses. Please verify you have completed these steps and then check which ff...2001:ee0* Posted at: 1 month ago -
#4358 1M上下文384K最大输出token的LLM模型,AI翻译渠道每批字幕行数这个参数应该填多少行?如果开启了AI翻译附带完整字幕,可以填多少行...
💬 13[Last reply:1 month ago] 基于128k最大输出token,按每行双语字幕平均消耗约50 tokens估算,一次最多可输出约 2500 行双语字幕。若模型智能欠佳导致翻译冗余,实际行数会稍低。若仅输出单语字幕,行数会更高,约 3500 行。通常在几千行以内的字幕文件都是安全的;若你的字幕超过3000行,建议分批或提前查行数。如需进一步提升安全性,可将“AI翻译渠道每批字幕行数”设为字幕总行数或9999,并同时勾选“AI翻译附...36.232* Posted at: 1 month ago -
#4356 怎么没有保存背景音乐的选项了...
💬 3[Last reply:1 month ago] 问题已解决,如有其他疑问可随时提出。...124.228* Posted at: 1 month ago -
#4357 有配置文件能改deepseekapi的思考模式吗?现在默认思考有点费token...
💬 1[Last reply:1 month ago] 暂无关于修改DeepSeek API思考模式的直接配置文件。pyVideoTrans调用DeepSeek时默认使用标准对话模型,若您发现消耗token过多,可能是因为选择了推理增强模型(如DeepSeek-R1系列)。可尝试以下步骤减少token消耗:在翻译渠道设置中,将模型名称手动改为非推理模型,例如 deepseek-chat(而非 deepseek-reasoner 等深度思考版本)。在“菜...122.230* Posted at: 1 month ago -
#4355 TaskCfgVTT(is_cuda=True, uuid='dccc4dafa7', cache_folder='D:/win-pyvideotrans-v3.99-420/tmp/11596/dccc4dafa7', target_dir='H:/MID/_video_out/hhd800.com@h_1711devr00016.part1_8K-wav...
💬 1[Last reply:1 month ago] 这是由于CUDA环境或显卡驱动与当前faster-whisper模型不兼容导致的,具体表现为cuBLAS运算不支持。解决方案(按推荐顺序尝试):关闭CUDA加速(立即可行):在主界面取消勾选“CUDA加速”选项,然后重新执行语音识别。虽然速度会变慢,但可确保任务完成。更新显卡驱动和CUDA环境:确保已安装NVIDIA显卡驱动最新版。安装CUDA 12.8和cuDNN 9.11及以上版本(软件内置支...240e:39e* Posted at: 1 month ago -
#4353 TaskCfgSTS(is_cuda=False, uuid='220dccb85b', cache_folder=None, target_dir='E:/PH/krenz comp 16/cn LLM', source_language=None, source_language_code='Simplified Chinese', source_sub...
💬 1[Last reply:1 month ago] This error occurs because the local AI translation service (e.g., Ollama) disconnected unexpectedly while processing the request. The server closed the connection without sending a response.Solutions ...202.150* Posted at: 1 month ago -
#4349 中文配音后,会弹出单独的交互窗口,我可以试听配音,也可以重新配音...
💬 9[Last reply:1 month ago] 界面试听的破音问题源自 PySide6/Qt 多媒体后端与部分 Windows 音频驱动的兼容性缺陷,目前知识库与软件内并无专门参数可彻底修复该播放组件自身的解码倾向。可尝试以下低概率缓解方式(不保证解决):更新声卡驱动至最新版,尤其是 Realtek 或独立显卡的 HDMI 音频驱动。在 Windows 声音设置中临时将扬声器属性 → 高级 → 默认格式改为 16 位 44100 Hz(或 48...2409:8a55* Posted at: 1 month ago -
#4352 TaskCfg(cache_folder='D:/pyvideotrans/tmp/10148/fc44d302ac', target_dir='H:/新建文件夹 (2)', remove_noise=False, is_separate=False, detect_language=None, subtitle_language=None, source_...
💬 1[Last reply:1 month ago] 该错误是磁盘空间不足导致的,软件在合成音频时无法写入临时文件。原因:输出目录 H:/新建文件夹 (2) 所在磁盘(H盘)或软件临时文件夹 D:/pyvideotrans/tmp 所在磁盘(D盘)已无可用空间。解决方法:查看磁盘可用空间:检查 D 盘和 H 盘的剩余容量,删除不需要的文件或移动文件到其他位置,确保至少有数 GB 的可用空间。清理软件缓存:关闭软件,进入 D:/pyvideotrans...27.189* Posted at: 1 month ago
Open source and free maintenance is not easy. If this project is helpful to you, please consider making a small donation to help the project continue to maintain and update.