Page 56 BBS.pyVideoTrans.com 怎么在识别前传入“上下文提示”来引导模型

#4650 怎么在识别前传入“上下文提示”来引导模型...

[Last reply:1 month ago] 不客气。...

120.236* Posted at: 1 month ago

#4649 sending frames to consumers: Invalid argument...

[Last reply:1 month ago] 这是由于文件路径或名称导致的 ffmpeg 参数错误，常见于路径过长、包含中文或特殊符号（如空格、表情符）。解决方案：将待处理的视频文件移动到浅层目录（例如 E:\videos），并重命名为简短纯英文字母（如 test.mp4）。确保 pyVideoTrans 软件安装目录也不含中文或特殊字符（推荐 E:\pyvideotrans）。如果仍然无效，尝试暂时关闭杀毒软件或将软件所在目录加入白名单。若...

103.151* Posted at: 1 month ago

#4648 TaskCfg(cache_folder='E:/win-videotrans-v3.80/tmp23460/speech2text', target_dir='c:/users/yokin/videos/pyvideotrans/recogn', remove_noise=False, is_separate=False, detect_language=...

💬 1

[Last reply:1 month ago] 这是由文件路径包含特殊字符（#、%23、中文、省略号）或文件名过长导致的。Windows 对命令行中的特殊符号和路径长度有限制，导致 ffmpeg 无法正确打开文件。解决方案：重命名音频文件：改为简短、纯英文或数字的名称，例如 audio.mp3。删除文件名中的 %23、#、中文、空格、省略号等特殊符号。迁移到浅层目录：将文件移动到磁盘根目录下的英文文件夹，例如 D:\videos\audio.m...

2408:8207* Posted at: 1 month ago

#4647 TaskCfgVTT(is_cuda=False, uuid='a868c791fc', cache_folder='D:/win-pyvideotrans-v3.97-0304/tmp/23096/a868c791fc', target_dir='D:/2222/Embryology,胚胎学/_video_out/Cell.Cycle.&.Genes.pa...

💬 1

[Last reply:1 month ago] 这是硅基流动API服务器过载返回的503临时错误，并非软件配置问题。解决方案：降低请求频率：在菜单栏工具/选项 → 高级选项 → 字幕翻译调整中，将AI翻译渠道每批字幕行数设为更小值（如5或10），并增大翻译后暂停秒（如5-10秒）若问题持续，建议更换翻译渠道，如DeepSeek、OpenAI或本地Ollama模型稍后网络空闲时段重试即可请查阅相关文档：翻译渠道出错分析与解决...

112.120* Posted at: 1 month ago

#4646 TaskCfgVTT(is_cuda=False, uuid='8db3616a2f', cache_folder='D:/pyVideo/tmp/10952/8db3616a2f', target_dir='C:/Users/Administrator/Desktop/YtbVideos/video-3/_video_out/完整-mp4', source...

💬 1

[Last reply:1 month ago] 模型文件SHA256校验失败，通常是由于下载不完整或文件损坏导致。解决方案：关闭软件。进入软件安装目录下的 models/ 文件夹（例如 D:/pyVideo/models/）。找到并删除与 openai-whisper 模型对应的文件夹（名称类似 models--... 或直接包含 large-v3 的文件夹）。重新启动软件，软件将自动重新下载该模型。如网络不稳定，建议配置代理（主界面“网络代理...

107.151* Posted at: 1 month ago

#4645 TaskCfgVTT(is_cuda=True, uuid='e979bed083', cache_folder='D:/pyvideotrans/tmp/13044/e979bed083', target_dir='C:/Users/Administrator/Desktop/healthmaneger/_video_out/Battlefield Med...

💬 1

[Last reply:1 month ago] 这是由于显存不足导致 faster-whisper 的进程崩溃（large-v3-turbo 模型需约 6-10GB 显存）。请按以下顺序尝试解决：切换为更小的模型：在主界面的语音识别模型中改为 base 或 medium（large 模型对显存要求高）。调整高级参数降低显存占用：菜单栏 → 工具/选项 → 高级选项 → 语音识别参数，做以下修改：将 CUDA数据类型从默认改为 int8将 be...

219.76* Posted at: 1 month ago

#4644 TaskCfgVTT(is_cuda=True, uuid='1693ffb826', cache_folder='D:/pyvideotrans/tmp/4044/1693ffb826', target_dir='C:/Users/Administrator/Desktop/healthmaneger/_video_out/Battlefield Medi...

💬 1

[Last reply:1 month ago] 这是由于显存不足导致的。您当前使用的 large-v3-turbo 模型需要大量显存（至少 8GB 以上），而您的 GPU 可能无法满足，导致子进程崩溃。解决方案（按推荐顺序尝试）：更换更小的模型：在语音识别渠道中将模型从 large-v3-turbo 改为 medium、small 或 base，再次尝试。降低显存占用：进入菜单 → 工具/选项 → 高级选项，找到语音识别参数区域，进行以下...

219.76* Posted at: 1 month ago

#4642 TaskCfgVTT(is_cuda=True, uuid='3242df484b', cache_folder='D:/win-pyvideotrans-v3.99-428/tmp/2976/3242df484b', target_dir='D:/youtobe视频/_video_out/GxT ｜ Community QnA4-20-mkv', sour...

💬 1

[Last reply:1 month ago] DeepSeek API返回了空数据导致程序内部错误。常见原因：API密钥无效、网络连接问题、或请求格式错误。解决方案检查菜单 → 翻译设置 → DeepSeek 中填写的 API Key 和接口地址是否正确。确保软件能正常访问 DeepSeek API（中国大陆用户可能需要配置网络代理）。在高级选项中尝试降低“AI翻译渠道每批字幕行数”（设为 5~10 行），并增加“翻译后暂停秒”（设为 2~3...

67.230* Posted at: 1 month ago

#4641 原稿文字和翻译的字幕重合了怎么编辑修改呢...

💬 1

[Last reply:1 month ago] 这是由于选择了“硬双字幕”模式，原始字幕与翻译字幕位置重叠。解决方法如下：在主界面点击 “设置更多参数...” → “修改硬字幕样式” ，在弹出的编辑器中调整两行字幕的垂直位置（如将原始字幕上移、翻译字幕下移）或增大行间距，避免重叠。如果不需要同时显示两种语言，请主界面选择 “嵌入硬字幕” （单字幕）或 “嵌入软字幕” （单字幕），取消双字幕模式。请查阅相关文档：修改硬字幕样式...

182.138* Posted at: 1 month ago

#4640 支持CUDA12.9吗...

💬 1

[Last reply:1 month ago] 支持。CUDA 12.9 属于 12.8+ 版本范围，软件理论兼容 12.8 及更高版本（包括 13.x），无需额外配置即可正常使用 GPU 加速。...

240e:3b5* Posted at: 1 month ago

#4639 RuntimeError: Unable to open file 'model.bin' in model 'C:/Users/User/Downloads/win-pyvideotrans-v3.99-0508/models/models--mobiuslabsgmbh--faster-whisper-large-v3-turbo'...

💬 1

[Last reply:1 month ago] This error indicates the model file model.bin is missing or incomplete in the directory models/models--mobiuslabsgmbh--faster-whisper-large-v3-turbo. This usually happens when the model download was i...

91.231* Posted at: 1 month ago

#4638 使用ffmpeg合成字幕和图片或者视频的时候总报错，🎬 [阶段5: 合成]📌 视觉模式: 原视频ffmpeg version 7.1.1-full_build-www.gyan.dev Copyright (c) 2000-2025 the......

💬 1

[Last reply:1 month ago] 这是由于 ffmpeg 无法找到字幕文件 subtitle.srt 导致的。解决方案：确认字幕文件是否存在：检查工作目录下是否有 subtitle.srt 文件，且文件名完全一致（包括大小写和扩展名）。简化文件路径：你的路径包含中文（视频洗稿并输出视频）和较长目录名，这可能导致 ffmpeg 解析失败。建议将视频和字幕文件移动到一个纯英文且短路径的目录下，例如 D:\workspace\。重命名文...

13.228* Posted at: 1 month ago

#4637 RuntimeError: {'message': 'tts failed', 'Exception': 'DLL load failed while importing onnxruntime_pybind11_state: 找不到指定的模块。'}...

💬 1

[Last reply:1 month ago] 这是由于系统缺少必要的Visual C++运行时组件导致onnxruntime动态链接库无法加载。解决方案：安装微软VC++运行库（x64版本）：下载地址，安装后重启软件。如果是通过升级补丁包覆盖安装的，请重新下载完整的软件包解压覆盖，然后再次启动sp.exe。若问题依旧，请到 logs/ 目录下提供最新的日志文件（复制底部约30行报错信息）以便进一步分析。请查阅相关文档：Windows系统安装 ...

220.130* Posted at: 1 month ago

#4636 Error code: 429 - {'error': {'message': 'The engine is currently overloaded, please try again later', 'type': 'engine_overloaded_error'}}...

💬 1

[Last reply:1 month ago] 这是服务端负载过高或请求频率过高导致的限流错误（HTTP 429）。通常因为同一时间段内请求过于密集，触发了API的速率限制。解决方案：如果是翻译阶段报错：打开菜单→工具→高级选项，降低“AI翻译渠道每批字幕行数”（建议设为1-5），并增加“翻译后暂停秒数”（设为3-5秒）。如果是配音阶段报错：同样在高级选项中，将“并发配音线程数”设为1，将“配音后暂停秒数”设为5-10秒。若使用的是Edge-T...

122.238* Posted at: 1 month ago

#4635 OmniVoice-TTS 下载安装包 app.py运行报错...

💬 5

[Last reply:1 month ago] 从截图中未看到具体错误信息，暂无法确定原因。请提供运行 app.py 时的完整终端报错日志（底部约30行），或直接描述报错提示内容。通用排查建议检查Python版本是否为3.10+（建议3.10）。确认已使用 pip install -r requirements.txt 或 uv sync 安装所有依赖。确保已安装 ffmpeg 并配置到环境变量。确认 app.py 所在路径不包含中文或特殊符号...

69.33* Posted at: 1 month ago

#4634 TaskCfg(cache_folder='D:/My Softwares/视频翻译配音 Pyvideotran 3.96/tmp/16092/2b81f05837', target_dir='E:/5/_video_out/[影视源www.gsy118.com] 偷窥狂和暴露狂 El mirón y la exhibicionista 1986[中文字幕]...

💬 1

[Last reply:1 month ago] 这是由于 openai-whisper 解码时产生了 NaN（无效数值），通常由 GPU 计算不稳定、音频文件异常或显存不足引起。解决方案：改用 faster-whisper：在“语音识别渠道”下拉菜单中选择 faster-whisper(本地)，这是更稳定的替代方案。降低 GPU 计算精度：进入菜单 → 工具 → 高级选项 → 语音识别参数，将 CUDA数据类型改为 float16 或 in...

120.217* Posted at: 1 month ago

#4633 [Errno 2] No such file or directory: 'solar2/zh-cn.wav'...

💬 1

[Last reply:1 month ago] 这是由于在配音设置中指定的参考音频文件 'solar2/zh-cn.wav' 不存在导致的。解决方案：确认使用的 TTS 渠道：如果使用的是 GPT-SoVITS 配音渠道，参考音频必须放在 GPT-SoVITS 软件的根目录下，然后在 pyVideoTrans 的菜单 → TTS 设置 → GPT-SoVITS 中填写文件名（含后缀，如 solar2/zh-cn.wav）。请...

39.149* Posted at: 1 month ago

#4632 requests.exceptions.ConnectionError: HTTPConnectionPool(host='127.0.0.1', port=9988): Max retries exceeded with url: /apitts (Caused by NewConnectionError('<urllib3.connection.HTTP...

💬 1

[Last reply:1 month ago] 这是由于软件尝试连接本地 TTS API 服务（地址 127.0.0.1:9988）但该服务未启动或端口不正确导致的。解决方案：确认您是否使用了需要独立运行 API 服务的配音渠道（如 F5-TTS、CosyVoice、GPT-SoVITS、ChatterBox 等）。如果是，请先启动对应的 API 服务终端窗口，并保持其运行。在软件顶部菜单 TTS设置中检查填写的 API 地址和端口号是否与您...

38.181* Posted at: 1 month ago

#4631 videotrans.configure._except.StopRetry: [WinError 10048] 通常每个套接字地址(协议/网络地址/端口)只允许使用一次。...

💬 1

[Last reply:1 month ago] 这是由于 F5-TTS 配音渠道并发连接数过高或网络端口被快速耗尽导致的。Windows 在短时间内发起大量 TCP 连接时会触发端口重用限制，从而出现此错误。解决方案：降低并发线程数：进入菜单工具/选项 → 高级选项 → 字幕配音调整，将并发配音线程数设为 1。增加配音后暂停秒数：在同一设置项下，将配音后暂停秒设为 5-10 秒。检查 F5-TTS 服务：确认外部 F5-TTS API...

183.14* Posted at: 1 month ago

#4630 TaskCfgVTT(is_cuda=True, uuid='b15bd29560', cache_folder='D:/software/pyvideotrans/tmp/21376/b15bd29560', target_dir='C:/Users/15358/Desktop/明日之丈样片 - S01E01 - 青山篇-mkv', source_lan...

💬 1

[Last reply:1 month ago] 这是由于CUDA环境与faster-whisper不兼容导致的，常见于RTX 50系列显卡。更新软件至最新版本：确认为v3.99（日志显示已满足）。修改高级选项：在菜单工具/选项 → 高级选项 → 语音识别参数中，将CUDA数据类型从默认改为float16或int8。降低模型精度：将识别准确度beam_size设为1，best_of设为1，以降低对cuBLAS的依赖。回退CUDA版本：如果上述无效...

103.197* Posted at: 1 month ago