Page 61 BBS.pyVideoTrans.com videotrans.configure._except.StopRetry: C:/Users/98546/Desktop/win-pyvideotrans-v3.99-0508/tmp/47584/42a2ab9b60/clone-4.wav is not exists

#4549 videotrans.configure._except.StopRetry: C:/Users/98546/Desktop/win-pyvideotrans-v3.99-0508/tmp/47584/42a2ab9b60/clone-4.wav is not exists...

[Last reply:2 months ago] 这是由于 OmniVoice-TTS 声音克隆功能找不到指定的参考音频文件 clone-4.wav。该文件应放置在软件根目录下的 f5-tts 文件夹内（OmniVoice 与 F5-TTS、CosyVoice 共用此目录），而非临时路径中。解决方案：将你的参考音频文件（例如 clone-4.wav）拷贝到软件安装目录下的 f5-tts 文件夹中。若没有该文件夹，请手动创建。确保音频文件名（含扩展...

223.115* Posted at: 2 months ago

#4546 TaskCfgSTT(is_cuda=True, uuid='e3ccd30378', cache_folder='D:/pyVideoTrans/tmp/11872/e3ccd30378', target_dir='D:/pyVideoTrans/output/recogn', source_language=None, source_language_c...

💬 15

[Last reply:2 months ago] 问题已确认：软件本身正常，之前卡住是因为长达2.5小时的视频使用了large-v3-turbo模型且未开启CUDA加速，纯CPU处理必然非常缓慢。启用CUDA加速并选择合适模型后，三分钟完成说明GPU已正常工作。后续处理长视频时，建议：始终勾选“CUDA加速”。模型选择：中文日语等非英语视频可先用 small 或 medium，质量与速度平衡；large-v3-turbo 适合高质量需求，配合CU...

240c:c983* Posted at: 2 months ago

#4548 怎么配置，翻译出来的比较流畅，说话的语速和语调...

💬 3

[Last reply:2 months ago] 勾选“发送完整字幕”后，软件会自动将当前已识别出的字幕文件（含时间轴和序号）整体发送给AI翻译渠道，无需用户手动提供额外字幕。...

146.103* Posted at: 2 months ago

#4547 TaskCfgSTS(is_cuda=False, uuid='b3096996f0', cache_folder=None, target_dir='C:/Users/Administrator/Documents/Downloads/win-pyvideotrans-v3.99-0508/output/translate', source_languag...

💬 1

[Last reply:2 months ago] DeepLX 翻译服务报 503 Service Unavailable，说明本地部署的 DeepLX 服务未正常运行或未启动。解决方案：确认 DeepLX 服务是否已启动：检查终端/命令行窗口是否仍在运行 DeepLX 服务，且监听端口为 1188。重新启动 DeepLX 服务：若未启动，请重新运行 DeepLX 程序。部署方法可参考下方文档。切换其他翻译渠道：临时改用 Google、微软翻译或...

64.118* Posted at: 2 months ago

#4545 [WinError 10061] 由于目标计算机积极拒绝，无法连接。Traceback (most recent call last): File "httpx\_transports\default.py", line 101, in ......

💬 1

[Last reply:2 months ago] 这是由于OmniVoice-TTS 配音渠道的API服务未运行或地址配置错误导致的连接被拒绝。解决方案：启动OmniVoice 服务：确保已独立部署并启动 OmniVoice-TTS 的 API 服务（默认地址通常为 http://127.0.0.1:7860），保持终端窗口不关闭。检查API地址配置：在软件菜单栏工具/选项 -> TTS设置 -> OmniVoice-TTS 中，确...

203.198* Posted at: 2 months ago

#4544 TaskCfgSTT(is_cuda=False, uuid='10005e118c', cache_folder='D:/ClipAI/win-pyvideotrans-v3.99-0508/tmp/61808/10005e118c', target_dir='D:/ClipAI/win-pyvideotrans-v3.99-0508/output/rec...

💬 1

[Last reply:2 months ago] 这是中国大陆网络无法直接访问 Google 识别 API 导致的连接超时错误。解决方案：在软件主界面“网络代理地址”文本框中，填入你的 VPN 或代理服务地址（格式如 http://127.0.0.1:10808），端口号请根据你的代理客户端实际设置填写。若你未使用代理，建议将语音识别渠道切换为不需要代理的渠道，例如：faster-whisper(本地)（推荐，使用本地模型，无需网络）qwen-a...

240e:348* Posted at: 2 months ago

#4543 TaskCfgSTS(is_cuda=False, uuid='e938027061', cache_folder=None, target_dir='C:/Users/user/Documents/WhisperJAV/output/ja.whisperjav/win-pyvideotrans-v3.99-0508/output/translate', s...

💬 1

[Last reply:2 months ago] Connection error 的根本原因是网络连接失败（DNS解析错误），DeepSeek API 在国内无法直接访问，需要配置网络代理或确认 API 地址正确。解决方案：配置网络代理在软件主界面的 “网络代理地址” 文本框中，填入你的 HTTP/HTTPS 代理地址，格式如 http://127.0.0.1:7890（端口以你的代理客户端的设置为准）。检查 DeepSeek API U...

183.179* Posted at: 2 months ago

#4542 TaskCfgVTT(is_cuda=True, uuid='bc3fdb16e7', cache_folder='E:/AI/pyvideotrans/tmp/22136/bc3fdb16e7', target_dir='C:/Users/56309/Videos/4K Video Downloader+/_video_out/How I Make Sty...

💬 1

[Last reply:2 months ago] 这是由于你的显卡不支持 faster-whisper 默认使用的 float16 或 int8_float16 加速模式。常见原因是显卡较老（如 GTX 10系及以下）、CUDA/cuDNN 版本不匹配，或驱动过旧。解决方案（按推荐顺序尝试）：切换计算类型至 float32：在菜单栏工具/选项 → 高级选项 → 语音识别参数中，将 CUDA数据类型改为 float32，然后重试。这会牺牲部分...

2408:8214* Posted at: 2 months ago

#4541 HuggingFace_ASR 语音识别渠道，模型kotoba-tech/kotoba-whisper-v2.0。是手动下载的放到sp.exe模型文件夹的，让后报错...

💬 5

[Last reply:2 months ago] 核心原因是 kotoba-tech/kotoba-whisper-v2.0 模型在处理音频片段时，部分片段缺少 num_frames 键，导致分批合并失败。这是该模型与当前软件分批机制的兼容性问题。解决方案：启用“Whisper预分割音频” 点击菜单 → 工具/选项 → 高级选项 → 语音识别参数 → 勾选 “Whisper预分割音频”。该选项会在送入模型前统一音频片段格式，解决键不一致问题。切...

111.194* Posted at: 2 months ago

#4539 运行这个软件显卡需要什么样的配置...

💬 3

[Last reply:2 months ago] 8GB显存运行 large-v3 模型可能会提示显存不足（该模型最低需要 10GB 显存）。但如果一定要尝试，可以通过以下调整来降低显存占用（效果可能打折扣）：1. 在菜单工具/选项 → 高级选项中：- 将 CUDA数据类型改为 int8- 将 beam_size 设为 1- 将 best_of 设为 1- 将上下文设为 false- 勾选 Whisper预分割音频2. 尽量关闭“二次识...

111.60* Posted at: 2 months ago

#4540 软件目录不能放在C盘吗...

💬 1

[Last reply:2 months ago] 不建议将软件目录放在C盘，尤其是 C:\Program Files 等需要管理员权限的目录，否则可能因权限不足导致程序无法启动或写文件失败。推荐解压到非系统盘（如 D 盘）且路径仅含英文和数字，例如 D:\pyVideoTrans。若必须放在C盘，建议放在 C:\pyVideoTrans 这类根目录下的纯英文路径，并确保当前用户有完全控制权限。...

111.60* Posted at: 2 months ago

#4538 TaskCfgVTT(is_cuda=True, uuid='617e3f9d82', cache_folder='E:/pyvideotrans/tmp/3784/617e3f9d82', target_dir='E:/SRT/gvh-351-mp4', source_language='日语', source_language_code='ja', so...

💬 1

[Last reply:2 months ago] 这是由于你的显卡或CUDA环境不支持 int8_float16 或 float16 计算类型导致的，常见于显卡计算能力较低（如 GTX 10系列以下）、CUDA版本过旧或缺cuDNN。请按以下步骤操作：降低CUDA数据类型：打开菜单栏工具/选项 → 高级选项 → 找到语音识别参数中的 CUDA数据类型，将其改为 float32 或 default，保存后重试。检查CUDA环境：确认已安装 C...

14.19* Posted at: 2 months ago

#320 为什么看教程是中文界面，而我安装打开是英文界面，没有切换语言按钮，我仔细确认了我的win系统是中文界面呀...

💬 8

[Last reply:2 months ago] 在 v3.99 的英文界面中，并没有一个明确标注为“Standard Fuction Mode”的选项或按钮。您可能指的是以下几种情况之一：主界面的功能选项卡：在软件主界面左侧有四个选项卡：Translate Video/Audio（翻译视频或音频）Batch Speech to Text（批量语音转字幕）Batch Dubbing（批量为字幕配音）Batch Subtitle Translati...

58.10* Posted at: 10 months ago

#4537 RuntimeError: [enforce fail at alloc_cpu.cpp:116] data. DefaultCPUAllocator: not enough memory: you tried to allocate 1244659712 bytes....

💬 1

[Last reply:2 months ago] 这是由于系统内存不足导致的，程序尝试分配约1.2GB内存失败。常见于使用本地语音识别模型（如qwen-asr）时未启用GPU加速或内存不足。解决方案：切换为更小的模型：在主界面将语音识别渠道从 qwen-asr(本地) 切换为 faster-whisper(本地)，并选择 small 或 base 模型，这些模型占用内存更少。开启CUDA加速（前提是您有NVIDIA显卡且已安装CUDA 12.8+...

117.145* Posted at: 2 months ago

#4536 openai.InternalServerError: Error code: 503 - {'error': {'message': 'Service temporarily unavailable', 'type': 'api_error'}}...

💬 1

[Last reply:2 months ago] 该错误表明调用 OpenAI 或兼容接口进行翻译时，服务端返回 "503 Service Temporarily Unavailable"，即翻译服务暂时不可用。解决方案：检查网络代理设置：如果使用了代理（如 VPN/Clash），请确认代理地址填写正确（格式如 http://127.0.0.1:10809）且代理服务正常运行。若无需代理，请清空代理地址。重试任务：这很可能是服务端临时过载或维护，...

108.181* Posted at: 2 months ago

#4535 RuntimeError: 模型下载不完整，请删除目录 D:/批量配语音===/models/models--mobiuslabsgmbh--faster-whisper-large-v3-turbo，重新下载...

💬 1

[Last reply:2 months ago] 模型文件损坏或不完整，需删除后重新下载。同时注意你的软件安装路径包含中文和特殊字符（D:/批量配语音===），这可能导致 ffmpeg 命令执行异常，建议将软件移动到纯英文目录（如 D:\pyVideoTrans）后重新下载模型。解决方案：关闭软件，手动删除报错中的目录 D:/批量配语音===/models/models--mobiuslabsgmbh--faster-whis...

171.43* Posted at: 2 months ago

#4534 维吾尔语配音渠道中都找不到配音角色...

💬 1

[Last reply:2 months ago] 由于常用的配音渠道（如 Edge-TTS、OpenAI TTS 等）对维吾尔语的支持有限，因此在下拉角色列表中可能找不到对应的发音人。解决方案：首先确保“目标语言”已正确选择为“维吾尔语”：在配音设置中，务必先选中“维吾尔语”作为目标语言，然后刷新配音角色列表。尝试使用免费且支持多语言的 Edge-TTS：虽然它内置了大量语言角色，但维吾尔语可能未被收录。如果仍无结果，请考虑以下替代方案。使用支持...

117.145* Posted at: 2 months ago

#4533 GPU跑不满...

💬 1

[Last reply:2 months ago] 这是正常现象。pyVideoTrans 仅在语音识别（ASR）阶段大量调用 GPU 进行运算，此阶段 GPU 占用会飙高；而字幕翻译、文本转语音、视频合成等阶段主要依赖 CPU，GPU 使用率自然较低。请查阅相关文档：GPU 使用率太低...

146.103* Posted at: 2 months ago

#4532 高棉语，卡在resegment...

💬 3

[Last reply:2 months ago] 从日志看，您已进入“二次识别”阶段，但可能卡在该步骤。高棉语属于低资源语言，faster-whisper large-v3-turbo 模型对高棉语识别准确度有限，二次识别是对配音音频再次转录，极易因匹配不到有效语音片段而陷入死循环或超时。解决方案（按推荐顺序尝试）：关闭二次识别：在主界面取消勾选“二次识别”（或“recogn2pass”），直接合成视频，避免额外转录步骤。调整二次识别参数：如果仍...

114.220* Posted at: 2 months ago

#4531 模型下载不完整，请删除目录 E:/影视解说需要的软件/音频转换软件/win-pyvideotrans-v3.98-323_20260323_131320/models/models--Systran--faster-whisper-large-v3，重新下载...

💬 1

[Last reply:2 months ago] 这是由于模型文件未下载完整导致的，通常是因为网络问题（如HuggingFace访问不稳定）。解决方案：删除不完整的模型文件夹：按提示删除 E:/影视解说需要的软件/.../models--Systran--faster-whisper-large-v3 整个文件夹。重新下载模型：软件会自动下载，但需保证网络通畅。中国大陆用户建议：配置网络代理（在软件主界面“网络代理地址”填写 http:/...

216.106* Posted at: 2 months ago

#4549 videotrans.configure._except.StopRetry: C:/Users/98546/Desktop/win-pyvideotrans-v3.99-0508/tmp/47584/42a2ab9b60/clone-4.wav is not exists...

#4546 TaskCfgSTT(is_cuda=True, uuid='e3ccd30378', cache_folder='D:/pyVideoTrans/tmp/11872/e3ccd30378', target_dir='D:/pyVideoTrans/output/recogn', source_language=None, source_language_c...

#4548 怎么配置，翻译出来的比较流畅，说话的语速和语调...

#4547 TaskCfgSTS(is_cuda=False, uuid='b3096996f0', cache_folder=None, target_dir='C:/Users/Administrator/Documents/Downloads/win-pyvideotrans-v3.99-0508/output/translate', source_languag...

#4545 [WinError 10061] 由于目标计算机积极拒绝，无法连接。Traceback (most recent call last): File "httpx\_transports\default.py", line 101, in ......

#4544 TaskCfgSTT(is_cuda=False, uuid='10005e118c', cache_folder='D:/ClipAI/win-pyvideotrans-v3.99-0508/tmp/61808/10005e118c', target_dir='D:/ClipAI/win-pyvideotrans-v3.99-0508/output/rec...

#4543 TaskCfgSTS(is_cuda=False, uuid='e938027061', cache_folder=None, target_dir='C:/Users/user/Documents/WhisperJAV/output/ja.whisperjav/win-pyvideotrans-v3.99-0508/output/translate', s...

#4542 TaskCfgVTT(is_cuda=True, uuid='bc3fdb16e7', cache_folder='E:/AI/pyvideotrans/tmp/22136/bc3fdb16e7', target_dir='C:/Users/56309/Videos/4K Video Downloader+/_video_out/How I Make Sty...

#4541 HuggingFace_ASR 语音识别渠道，模型kotoba-tech/kotoba-whisper-v2.0。是手动下载的放到sp.exe模型文件夹的，让后报错...

#4539 运行这个软件显卡需要什么样的配置...

#4540 软件目录不能放在C盘吗...

#4538 TaskCfgVTT(is_cuda=True, uuid='617e3f9d82', cache_folder='E:/pyvideotrans/tmp/3784/617e3f9d82', target_dir='E:/SRT/gvh-351-mp4', source_language='日语', source_language_code='ja', so...

#320 为什么看教程是中文界面，而我安装打开是英文界面，没有切换语言按钮，我仔细确认了我的win系统是中文界面呀...

#4537 RuntimeError: [enforce fail at alloc_cpu.cpp:116] data. DefaultCPUAllocator: not enough memory: you tried to allocate 1244659712 bytes....

#4536 openai.InternalServerError: Error code: 503 - {'error': {'message': 'Service temporarily unavailable', 'type': 'api_error'}}...

#4535 RuntimeError: 模型下载不完整，请删除目录 D:/批 量 配语音===/models/models--mobiuslabsgmbh--faster-whisper-large-v3-turbo，重新下载...

#4534 维吾尔语配音渠道中都找不到配音角色...

#4533 GPU跑不满...

#4532 高棉语，卡在resegment...

#4531 模型下载不完整，请删除目录 E:/影视解说需要的软件/音频转换软件/win-pyvideotrans-v3.98-323_20260323_131320/models/models--Systran--faster-whisper-large-v3，重新下载...

Related resource

#4535 RuntimeError: 模型下载不完整，请删除目录 D:/批量配语音===/models/models--mobiuslabsgmbh--faster-whisper-large-v3-turbo，重新下载...