Page 71 BBS.pyVideoTrans.com TaskCfgSTS(is_cuda=False, uuid='220dccb85b', cache_folder=None, target_dir='E:/PH/krenz comp 16/cn LLM', source_language=None, source_language_code='Simplified Chinese', source_sub='E:/PH/krenz comp 16/cn LLM/250611.srt', source_wav=None, source_wav_output=None, target_language=None, target_language_code='English', target_sub='E:/PH/krenz comp 16/cn LLM/250611.English.srt', target_wav=None, target_wav_output=None, name='E:/PH/krenz comp 16/cn LLM/250611.srt', noextname='250611', basename='250611.srt', ext='srt', dirname='E:/PH/krenz comp 16/cn LLM', shound_del_name=None, translate_type=8)

#4353 TaskCfgSTS(is_cuda=False, uuid='220dccb85b', cache_folder=None, target_dir='E:/PH/krenz comp 16/cn LLM', source_language=None, source_language_code='Simplified Chinese', source_sub...

[Last reply:2 months ago] This error occurs because the local AI translation service (e.g., Ollama) disconnected unexpectedly while processing the request. The server closed the connection without sending a response.Solutions ...

202.150* Posted at: 2 months ago

#4349 中文配音后，会弹出单独的交互窗口，我可以试听配音，也可以重新配音...

💬 9

[Last reply:2 months ago] 界面试听的破音问题源自 PySide6/Qt 多媒体后端与部分 Windows 音频驱动的兼容性缺陷，目前知识库与软件内并无专门参数可彻底修复该播放组件自身的解码倾向。可尝试以下低概率缓解方式（不保证解决）：更新声卡驱动至最新版，尤其是 Realtek 或独立显卡的 HDMI 音频驱动。在 Windows 声音设置中临时将扬声器属性 → 高级 → 默认格式改为 16 位 44100 Hz（或 48...

2409:8a55* Posted at: 2 months ago

#4352 TaskCfg(cache_folder='D:/pyvideotrans/tmp/10148/fc44d302ac', target_dir='H:/新建文件夹 (2)', remove_noise=False, is_separate=False, detect_language=None, subtitle_language=None, source_...

💬 1

[Last reply:2 months ago] 该错误是磁盘空间不足导致的，软件在合成音频时无法写入临时文件。原因：输出目录 H:/新建文件夹 (2) 所在磁盘（H盘）或软件临时文件夹 D:/pyvideotrans/tmp 所在磁盘（D盘）已无可用空间。解决方法：查看磁盘可用空间：检查 D 盘和 H 盘的剩余容量，删除不需要的文件或移动文件到其他位置，确保至少有数 GB 的可用空间。清理软件缓存：关闭软件，进入 D:/pyvideotrans...

27.189* Posted at: 2 months ago

#4351 自己下载的本地模型可以添加进来吗...

💬 5

[Last reply:2 months ago] 断句粘连的常见原因是语音识别参数中“最长语音持续秒数”设置得过大，导致模型将多个句子当成长段输出，或者识别后没有进行有效分割。请在菜单 → 工具/选项 → 高级选项 → 语音识别参数中尝试以下调整（修改后立即生效）：将最长语音持续秒数改为 5 或更小（如 3），强制在较长静音处分割。将静音分割持续毫秒改为 200，降低分割门槛，使短停顿时也切分句子。将语音阈值设为 0.5 左右，避...

120.236* Posted at: 2 months ago

#4345 有没有视频语音提取转文字...

💬 15

[Last reply:2 months ago] 软件官方仅适配 CUDA 12.8 环境，在 CUDA 13.2 + cuDNN 9.2 组合下，默认的 float32 数据类型可能引发兼容性或显存压力，导致 GPU 加速失效。将 “CUDA 数据类型” 改为 float16 可以降低资源占用和部分兼容性要求，从而避开问题正常执行。建议保持此项设置为 float16 继续使用。若后续遇到其他 GPU 相关报错，推荐降级 CUDA 至 12.8 ...

2a09:bac5* Posted at: 2 months ago

#4350 TaskCfgSTT(is_cuda=True, uuid='7818646aeb', cache_folder='E:/win-pyvideotrans-v3.99-428/tmp/13252/7818646aeb', target_dir='E:/win-pyvideotrans-v3.99-428/output/recogn', source_lang...

💬 7

[Last reply:2 months ago] 已确认问题根源在于 CUDA 加速与当前显卡或环境的兼容性，而非识别功能本身。若仍希望开启 CUDA 加速以提升速度，请按顺序尝试：先调整高级参数打开菜单 → 工具/选项 → 高级选项 → 语音识别参数，做以下修改：CUDA数据类型：改为 int8beam_size：设为 1best_of：设为 1 保存后重新勾选主界面的“CUDA 加速”，再次执行识别。验证 cuDNN 环境确保 c...

2a09:bac5* Posted at: 2 months ago

#4348 TaskCfgSTT(is_cuda=True, uuid='3ffe60a02a', cache_folder='E:/win-pyvideotrans-v3.99-428/tmp/13252/3ffe60a02a', target_dir='E:/win-pyvideotrans-v3.99-428/output/recogn', source_lang...

💬 1

[Last reply:2 months ago] 该错误是因为 cuBLAS（CUDA基础线性代数库）返回了 CUBLAS_STATUS_NOT_SUPPORTED，通常发生在 RTX 50 系列或其他新架构显卡上，当前 faster-whisper 版本尚不完全兼容。解决方案（按推荐顺序尝试）关闭 CUDA 加速在主界面取消勾选“CUDA加速”选项，然后重新开始任务。此时将使用 CPU 进行处理，速度较慢但能避免该错误。调整 CUDA 数据...

2a09:bac5* Posted at: 2 months ago

#4347 AttributeError: module 'decoders' has no attribute 'DecodeStream'...

💬 1

[Last reply:2 months ago] 该错误是 Python 环境中的 tokenizers 库版本不兼容导致的，通常发生在使用旧版补丁覆盖或打包文件不完整的情况下。请按以下顺序排查：重新下载完整包：前往官网下载最新的 v3.99 完整软件包（不要只下载升级补丁），将其解压到一个全新、路径不含中文和特殊符号的文件夹（例如 D:\pyVideoTrans），然后双击 sp.exe 运行。检查运行环境：确保已经安装了微软 VC++ 运行...

218.173* Posted at: 2 months ago

#4346 如何进行视频里多角色翻译和配音？...

💬 1

[Last reply:2 months ago] 实现多角色翻译和配音，核心需要启用“说话人分离”并为不同说话人分配不同的配音角色。以下是操作步骤：在主界面勾选“识别说话人”（位于“设置更多参数…”区域），根据视频中说话人数预估一个数值，不限制时软件自动判断。选择语音识别渠道（如 faster-whisper）并设定好模型，开始执行语音识别，识别结束后会弹出字幕编辑窗口。在字幕编辑窗口中，每一条字幕可指定其对应的说话人（软件会自动预分配，但建议手...

140.245* Posted at: 2 months ago

#4344 怎么把下载的模型删除掉...

💬 1

[Last reply:2 months ago] 这是因为模型文件都保存在软件安装目录下的 models 文件夹内，直接删除对应的模型子文件夹即可。操作步骤：进入 pyVideoTrans 的安装目录（即 sp.exe 或 sp.py 所在位置）。打开 models 文件夹。找到你不想要的模型文件夹，例如：models--Systran--faster-whisper-large-v3 (对应 large-v3 模型)models--Systra...

36.230* Posted at: 2 months ago

#4343 比如3DS，配音是“3毫秒”，我想发单个字母的声音，还有就是让所有大写的单个字母都发字母音，需要怎么设置，或者有提示词设置吗...

💬 1

[Last reply:2 months ago] 这是由于 TTS 引擎对缩写/大写字母组合的发音处理方式导致的，pyVideoTrans 本身不提供拼读字母的自动转换开关。需要从字幕文本层面手动干预。解决方案：在字幕处理阶段修改文本：在语音识别和翻译完成后，人工检查字幕文件（SRT），将需要拼读的大写字母组合（如 3DS）手动替换为带空格的单个字符形式“3 D S”。这样 TTS 引擎会逐个读出字母发音。批量替换：如果有大量类似缩写，可使用字幕...

2409:8a55* Posted at: 2 months ago

#4342 音频比视频要慢了大概10秒左右，要怎么处理？...

💬 1

[Last reply:2 months ago] 音频比视频慢了约10秒，是由于翻译后的配音时长与原始语音时长不一致导致的。处理步骤如下：开启对齐选项：在主界面勾选配音加速和/或视频慢速，强制使配音与原视频时长匹配。开启二次识别：勾选二次识别，软件会在配音完成后再次对配音音频进行语音识别，生成精准匹配配音的字幕，确保字幕与声音对齐。调整配音速度：如果仅慢10秒，可尝试在配音语速中设置一个正值（如 10 或 15），整体加速配音。精细控...

218.173* Posted at: 2 months ago

#4341 FileNotFoundError: [WinError 206] 文件名或扩展名太长。: 'C:\\Users\\hasee\\Downloads\\_video_out\\2 X 上的 Filecoin：“Cardano s @IOHK_Charles and @FilFoundation President @MartaBelcher chat abo...

💬 1

[Last reply:2 months ago] 原因是 Windows 系统对文件路径有最大长度限制（通常为 260 个字符），你的原视频文件名太长，导致自动生成的输出目录完整路径超出了系统限制。解决方法：将原视频文件移动到一个浅层目录（如 D:\videos），并将视频重命名为简短英文或数字名称（例如 video1.mp4）。避免文件名中含中文、特殊符号或过长字符。在软件主界面点击“输出到..”按钮，将输出目录设置为一个同样较浅且无特殊符号的...

64.186* Posted at: 2 months ago

#4283 术语表是不是区分大小写的？...

💬 18

[Last reply:2 months ago] 要实现“忽略术语原词大小写，仅匹配字母序列”这一规则，你需要直接在所使用的翻译渠道的提示词中添加明确指令。以下是具体的操作步骤和示例：1. 确定要修改的提示词文件位置如果你勾选了【发送完整字幕】，需要修改：[软件目录]/videotrans/prompts/srt/deepseek.txt （如果使用其他渠道，请选择对应文件）如果未勾选，需要修改：[软件目录]/videotrans/promp...

2409:8a55* Posted at: 2 months ago

#4339 videotrans.configure._except.StopRetry: No Ref Audio. Clone disabled....

💬 1

[Last reply:2 months ago] This error occurs because the audio cloning feature is enabled (a clone voice role is selected) but no valid reference audio is found or the extracted speech segments are outside the required duration...

191.6* Posted at: 2 months ago

#4338 whisper语音识别问题...

💬 17

[Last reply:2 months ago] 软件中 DeepSeek 作为翻译渠道时，模型名称需要手动输入，而非在下拉菜单直接选择。目前知识库未提供 DeepSeek 官方支持的全部模型列表，但常见的可用模型包括：deepseek-chat（即 DeepSeek-V3 最新对话模型）deepseek-reasoner（即 DeepSeek-R1 推理模型，适合复杂逻辑）deepseek-v3-flash 等不同后缀版本（视官方公告）在软件中...

112.22* Posted at: 2 months ago

#4337 win-pyvideotrans-v3.99-428执行后没生成.mp4文件...

💬 3

[Last reply:2 months ago] WebM 格式（通常 VP8/VP9 编码）与 FFmpeg 硬件加速的兼容性较差，即使勾选输出为 MP4，合成阶段也容易因解码器或滤镜链冲突卡死。解决方案（按推荐顺序）：禁用硬件解码/编码打开菜单 → 工具/选项 → 高级选项：取消勾选视频合成cuda硬解码取消勾选主界面 CUDA加速（如果仍在勾选状态）然后重新翻译同一视频。这样会自动转用纯 CPU 软编解码，虽慢但能稳定处理 W...

2a09:bac1* Posted at: 2 months ago

#4336 concurrent.futures._base.CancelledError...

💬 1

[Last reply:2 months ago] 这是 F5-TTS 配音服务连接或响应异常导致的 CancelledError，通常表示 API 请求被中断或超时。解决方案：检查 F5-TTS 服务是否正在运行，命令行窗口是否被关闭。确认软件中的 API 地址设置正确（默认 http://127.0.0.1:7860），端口没有被其他程序占用。确保参考音频文件放在软件目录/f5-tts 文件夹内，且时长在 3-10 秒之间。在菜单 “工具/选...

240e:399* Posted at: 2 months ago

#4335 requests.exceptions.ProxyError: HTTPSConnectionPool(host='translate.google.com', port=443): Max retries exceeded with url: /m?sl=zh-cn&tl=en&hl=en&q=%E4%BD%A0%E6%83%B3%E6%80%8E%E4%...

💬 1

[Last reply:2 months ago] 错误信息明确指向 Google翻译因代理不可达导致的连接失败。你的软件中启用了网络代理，但该代理地址无效或被拒绝连接。解决方案（二选一）：方案一：关闭代理（推荐，如果你在国内无可用代理）在主界面网络代理地址文本框中，删除已填写的所有内容，保持完全空白。将翻译渠道更换为无需代理的服务，例如：微软翻译、百度翻译、腾讯翻译（免费或需自行获取API Key）。DeepLX（需自行部署，但部署后无需代理）...

156.226* Posted at: 2 months ago

#4333 在哪能够看到小版本升级的内容...

💬 2

[Last reply:2 months ago] 未作记录，有需要直接查看 github 上的简要 commit 日志...

103.172* Posted at: 2 months ago

#4353 TaskCfgSTS(is_cuda=False, uuid='220dccb85b', cache_folder=None, target_dir='E:/PH/krenz comp 16/cn LLM', source_language=None, source_language_code='Simplified Chinese', source_sub...

#4349 中文配音后，会弹出单独的交互窗口，我可以试听配音，也可以重新配音...

#4352 TaskCfg(cache_folder='D:/pyvideotrans/tmp/10148/fc44d302ac', target_dir='H:/新建文件夹 (2)', remove_noise=False, is_separate=False, detect_language=None, subtitle_language=None, source_...

#4351 自己下载的本地模型可以添加进来吗...

#4345 有没有视频语音提取转文字...

#4350 TaskCfgSTT(is_cuda=True, uuid='7818646aeb', cache_folder='E:/win-pyvideotrans-v3.99-428/tmp/13252/7818646aeb', target_dir='E:/win-pyvideotrans-v3.99-428/output/recogn', source_lang...

#4348 TaskCfgSTT(is_cuda=True, uuid='3ffe60a02a', cache_folder='E:/win-pyvideotrans-v3.99-428/tmp/13252/3ffe60a02a', target_dir='E:/win-pyvideotrans-v3.99-428/output/recogn', source_lang...

#4347 AttributeError: module 'decoders' has no attribute 'DecodeStream'...

#4346 如何进行视频里多角色翻译和配音？...

#4344 怎么把下载的模型删除掉...

#4343 比如3DS，配音是“3毫秒”，我想发单个字母的声音，还有就是让所有大写的单个字母都发字母音，需要怎么设置，或者有提示词设置吗...

#4342 音频比视频要慢了大概10秒左右，要怎么处理？...

#4341 FileNotFoundError: [WinError 206] 文件名或扩展名太长。: 'C:\\Users\\hasee\\Downloads\\_video_out\\2 X 上的 Filecoin：“Cardano s @IOHK_Charles and @FilFoundation President @MartaBelcher chat abo...

#4283 术语表是不是区分大小写的？...

#4339 videotrans.configure._except.StopRetry: No Ref Audio. Clone disabled....

#4338 whisper语音识别问题...

#4337 win-pyvideotrans-v3.99-428执行后没生成.mp4文件...

#4336 concurrent.futures._base.CancelledError...

#4335 requests.exceptions.ProxyError: HTTPSConnectionPool(host='translate.google.com', port=443): Max retries exceeded with url: /m?sl=zh-cn&tl=en&hl=en&q=%E4%BD%A0%E6%83%B3%E6%80%8E%E4%...

#4333 在哪能够看到小版本升级的内容...

Related resource