-
#4541 HuggingFace_ASR 语音识别渠道,模型kotoba-tech/kotoba-whisper-v2.0。是手动下载的放到sp.exe模型文件夹的,让后报错...
💬 5[Last reply:59 minutes ago] 核心原因是 kotoba-tech/kotoba-whisper-v2.0 模型在处理音频片段时,部分片段缺少 num_frames 键,导致分批合并失败。这是该模型与当前软件分批机制的兼容性问题。解决方案:启用“Whisper预分割音频” 点击菜单 → 工具/选项 → 高级选项 → 语音识别参数 → 勾选 “Whi...111.194* Posted at: 1 hour ago -
#4539 运行这个软件显卡需要什么样的配置...
💬 3[Last reply:3 hours ago] 8GB显存运行 large-v3 模型可能会提示显存不足(该模型最低需要 10GB 显存)。但如果一定要尝试,可以通过以下调整来降低显存占用(效果可能打折扣):1. 在菜单 工具/选项 → 高级选项 中:- 将 CUDA数据类型 改为 int8- 将 beam_size 设为 1- 将 best_of 设为 1- 将 ...111.60* Posted at: 3 hours ago -
#4540 软件目录不能放在C盘吗...
💬 1[Last reply:3 hours ago] 不建议将软件目录放在C盘,尤其是 C:\Program Files 等需要管理员权限的目录,否则可能因权限不足导致程序无法启动或写文件失败。推荐解压到非系统盘(如 D 盘)且路径仅含英文和数字,例如 D:\pyVideoTrans。若必须放在C盘,建议放在 C:\pyVideoTrans 这类根目录下的纯英文路径,并确...111.60* Posted at: 3 hours ago -
#4538 TaskCfgVTT(is_cuda=True, uuid='617e3f9d82', cache_folder='E:/pyvideotrans/tmp/3784/617e3f9d82', target_dir='E:/SRT/gvh-3...
💬 1[Last reply:5 hours ago] 这是由于你的显卡或CUDA环境不支持 int8_float16 或 float16 计算类型导致的,常见于显卡计算能力较低(如 GTX 10系列以下)、CUDA版本过旧或缺cuDNN。请按以下步骤操作:降低CUDA数据类型:打开菜单栏 工具/选项 → 高级选项 → 找到 语音识别参数 中的 CUDA数据类型,将其改为 ...14.19* Posted at: 5 hours ago -
#320 为什么看教程是中文界面,而我安装打开是英文界面,没有切换语言按钮,我仔细确认了我的win系统是中文界面呀...
💬 8[Last reply:6 hours ago] 在 v3.99 的英文界面中,并没有一个明确标注为“Standard Fuction Mode”的选项或按钮。您可能指的是以下几种情况之一:主界面的功能选项卡:在软件主界面左侧有四个选项卡:Translate Video/Audio(翻译视频或音频)Batch Speech to Text(批量语音转字幕)Batch ...58.10* Posted at: 8 months ago -
#4537 RuntimeError: [enforce fail at alloc_cpu.cpp:116] data. DefaultCPUAllocator: not enough memory: you tried to allocate 12...
💬 1[Last reply:8 hours ago] 这是由于系统内存不足导致的,程序尝试分配约1.2GB内存失败。常见于使用本地语音识别模型(如qwen-asr)时未启用GPU加速或内存不足。解决方案:切换为更小的模型:在主界面将语音识别渠道从 qwen-asr(本地) 切换为 faster-whisper(本地),并选择 small 或 base 模型,这些模型占用内...117.145* Posted at: 8 hours ago -
#4536 openai.InternalServerError: Error code: 503 - {'error': {'message': 'Service temporarily unavailable', 'type': 'api_erro...
💬 1[Last reply:11 hours ago] 该错误表明调用 OpenAI 或兼容接口进行翻译时,服务端返回 "503 Service Temporarily Unavailable",即翻译服务暂时不可用。解决方案:检查网络代理设置:如果使用了代理(如 VPN/Clash),请确认代理地址填写正确(格式如 http://127.0.0.1:10809)且代理服务...108.181* Posted at: 11 hours ago -
#4535 RuntimeError: 模型下载不完整,请删除目录 D:/批 量 配语音===/models/models--mobiuslabsgmbh--faster-whisper-large-v3-turbo,重新下载...
💬 1[Last reply:12 hours ago] 模型文件损坏或不完整,需删除后重新下载。同时注意你的软件安装路径包含中文和特殊字符(D:/批 量 配语音===),这可能导致 ffmpeg 命令执行异常,建议将软件移动到纯英文目录(如 D:\pyVideoTrans)后重新下载模型。解决方案:关闭软件,手动删除报错中的目录 D:/批 量 配语音===/mo...171.43* Posted at: 12 hours ago -
#4534 维吾尔语配音渠道中都找不到配音角色...
💬 1[Last reply:13 hours ago] 由于常用的配音渠道(如 Edge-TTS、OpenAI TTS 等)对维吾尔语的支持有限,因此在下拉角色列表中可能找不到对应的发音人。解决方案:首先确保“目标语言”已正确选择为“维吾尔语”:在配音设置中,务必先选中“维吾尔语”作为目标语言,然后刷新配音角色列表。尝试使用免费且支持多语言的 Edge-TTS:虽然它内置了...117.145* Posted at: 13 hours ago -
#4533 GPU跑不满...
💬 1[Last reply:14 hours ago] 这是正常现象。pyVideoTrans 仅在语音识别(ASR)阶段大量调用 GPU 进行运算,此阶段 GPU 占用会飙高;而字幕翻译、文本转语音、视频合成等阶段主要依赖 CPU,GPU 使用率自然较低。请查阅相关文档:GPU 使用率太低...146.103* Posted at: 14 hours ago -
#4532 高棉语,卡在resegment...
💬 3[Last reply:16 hours ago] 从日志看,您已进入“二次识别”阶段,但可能卡在该步骤。高棉语属于低资源语言,faster-whisper large-v3-turbo 模型对高棉语识别准确度有限,二次识别是对配音音频再次转录,极易因匹配不到有效语音片段而陷入死循环或超时。解决方案(按推荐顺序尝试):关闭二次识别:在主界面取消勾选“二次识别”(或“re...114.220* Posted at: 16 hours ago -
#4531 模型下载不完整,请删除目录 E:/影视解说需要的软件/音频转换软件/win-pyvideotrans-v3.98-323_20260323_131320/models/models--Systran--faster-whisper-larg...
💬 1[Last reply:21 hours ago] 这是由于模型文件未下载完整导致的,通常是因为网络问题(如HuggingFace访问不稳定)。解决方案:删除不完整的模型文件夹: 按提示删除 E:/影视解说需要的软件/.../models--Systran--faster-whisper-large-v3 整个文件夹。重新下载模型: 软件会自动下载,但需保证网络通畅...216.106* Posted at: 21 hours ago -
#4530 videotrans.util.help_ffmpeg._FFprobeInternalError: [mov,mp4,m4a,3gp,3g2,mj2 @ 0000021a1665ecc0] moov atom not found D:/p...
💬 1[Last reply:1 day ago] 这是由于 ffmpeg 在处理视频时生成的临时文件 novoice.mp4 损坏或未完成(moov atom not found),通常由磁盘空间不足、意外中断或原始视频本身问题导致。解决方案:清理临时文件:关闭软件,删除 D:\pyvideotrans\tmp 文件夹下的所有内容,然后重新运行任务。检查磁盘空间:确保...125.71* Posted at: 1 day ago -
#4528 TaskCfgSTT(is_cuda=True, uuid='2ea1a37a28', cache_folder='J:/pyvideotrans-v3.99-0508/tmp/6424/2ea1a37a28', target_dir='J...
💬 7[Last reply:1 day ago] 你的 GTX 1650 显存仅 4-6GB,而 openai-whisper large-v3 模型至少需要 10GB 显存,因此模型加载后直接溢出 NaN。这是硬件限制,请按以下步骤操作:立即更换识别渠道:在主界面语音识别渠道下拉列表中,选择 faster-whisper(本地),该实现比 openai-whispe...103.62* Posted at: 1 day ago -
#4529 TaskCfgTTS(is_cuda=True, uuid='c7466dbf98', cache_folder='/home/artworker/tts/pyvideotrans-3.99/tmp/24170/c7466dbf98', t...
💬 1[Last reply:1 day ago] 这是由于无法连接到OmniVoice TTS服务导致的超时错误。确认OmniVoice服务正在运行:确保部署的OmniVoice API终端窗口未被关闭,并能通过浏览器访问API地址(例如 http://127.0.0.1:7860)。检查API地址配置:在软件菜单 TTS设置 → F5-TTS(OmniVoice与此...104.28* Posted at: 1 day ago -
#4527 添加维吾尔语,如何添加配音角色?...
💬 3[Last reply:1 day ago] Edge-TTS(免费)自称支持所有语言,可以尝试直接选择该渠道并查看配音角色列表是否包含维吾尔语。若没有,则需要使用支持声音克隆的本地TTS(如F5-TTS、GPT-SoVITS、CosyVoice等),将原视频中的维吾尔语音色作为参考音频进行克隆。请查阅相关文档:Edge-TTS 配音渠道如何使用原视频中音色配音F...223.116* Posted at: 1 day ago -
#4526 File not found: D:/Pyvidiotrans/videotrans/voicejson/elevenlabs.json...
💬 1[Last reply:1 day ago] The error File not found: D:/Pyvidiotrans/videotrans/voicejson/elevenlabs.json indicates a missing configuration file essential for the ElevenLabs TTS channel. ...114.79* Posted at: 1 day ago -
#4525 aiohttp.client_exceptions.ClientConnectorError: Cannot connect to host speech.platform.bing.com:443 ssl:<ssl.SSLContext ...
💬 1[Last reply:1 day ago] Edge-TTS 连接 speech.platform.bing.com 失败,很可能是网络问题导致(如国内网络限制或代理未配置正确)。配置网络代理:在主界面“网络代理地址”中填入您的有效代理地址(例如 http://127.0.0.1:7890),确保能访问 speech.platform.bing.com。降低并发...2402:a7c0* Posted at: 1 day ago -
#4524 TaskCfg(cache_folder='E:/pyvideotrans/396/tmp/19464/a39a42e341', target_dir='C:/Users/Administrator/Desktop/_video_out/0...
💬 3[Last reply:1 day ago] 这是由于软件版本 v3.96 中目标语言代码映射不完整造成的 bug,已在 v3.99 版本修复。请直接下载最新完整包覆盖安装: pyVideoTrans 下载页 升级后重新执行同一任务即可正常合成,无需其他额外操作。...66.90* Posted at: 1 day ago -
#4523 RuntimeError: File model.bin is incomplete: failed to read a buffer of size 3145728 at position 781510598...
💬 1[Last reply:1 day ago] 这是由于本地 M2M100 翻译模型的 model.bin 文件下载不完整或已损坏所导致的。解决方案:删除损坏的模型文件:进入软件安装目录下的 models/ 文件夹,找到 m2m100(或类似名称)的子文件夹,删除其中名为 model.bin 的文件。重新触发下载:重启软件,再次执行翻译任务,软件会自动重新下载完整的...2402:a7c0* Posted at: 1 day ago
Open source and free maintenance is not easy. If this project is helpful to you, please consider making a small donation to help the project continue to maintain and update.