-
#3839 语音识别泰英的,用那个版本最好...
💬 5[Last reply:2 months ago] 日志显示软件已检测到GPU并启用了CUDA加速(is_cuda=True),但语音识别阶段仍然卡住。问题核心在于 faster-whisper large-v3 模型文件未正确加载。您提供的日志缺少模型下载或加载的关键信息,表明程序在初始化识别器时卡住。解决方案:确认模型文件已手动下载并放置正确:检查路径 D:\BaiduNetdiskDownload\win-pyvideotrans-v3.98...210.79* Posted at: 2 months ago -
#3841 607.MP3没有识别出字幕,请检查是否包含人类说话声音,以及说话语言是否和你选择的原始语言匹配...
💬 1[Last reply:2 months ago] 该问题通常是由于视频/音频中不含有效人声、背景噪音过大或原始语言选择错误导致的。解决方案:检查音频内容:使用播放器打开 607.MP3,确认其中确实包含清晰的人声说话内容。验证原始语言设置:在软件主界面“发音语言”下拉列表中,确保选择的是音频中人物实际使用的语言(例如,如果是中文对话,必须选择“中文”)。不要过度依赖“自动检测”,在视频翻译功能中已移除此选项。开启降噪:如果音频背景噪音较大,请勾选...38.107* Posted at: 2 months ago -
#3840 TaskCfg(cache_folder='D:/Download/win-pyvideotrans-v3.86/tmp13444/speech2text', target_dir='D:/Download/win-pyvideotrans-v3.86/output/recogn', remove_noise=False, is_separate=False...
💬 1[Last reply:2 months ago] 这是由于软件安装路径权限问题导致模型下载失败。错误信息显示在创建符号链接时“客户端没有所需的特权”,通常是因为软件被解压到了需要管理员权限的目录(如 C:\Program Files)或在压缩包内直接运行。解决方案:重新解压软件:将软件完整包(.7z文件)解压到非系统盘(如 D:\)的英文路径下,例如 D:\pyVideoTrans。确保路径中不包含中文、空格或特殊符号。避免权限目录:禁止解压到 ...2409:8a02* Posted at: 2 months ago -
#3838 TaskCfgVTT(is_cuda=True, uuid='700615b36e', cache_folder='D:/project/Videotrans/win-pyvideotrans-v3.97-0304/tmp/9900/700615b36e', target_dir='E:/编程/langchain课程/_video_out/100-9. Ha...
💬 1[Last reply:2 months ago] 该错误是由于您的 NVIDIA 显卡(推测为 50 系列新架构)与当前 CUDA 环境不完全兼容导致的。具体报错 RuntimeError: cuBLAS failed with status CUBLAS_STATUS_NOT_SUPPORTED 表明在调用 cuBLAS 库时遇到了不支持的操作。请按以下步骤解决:升级软件版本:此问题在 v3.98 及更高版本中已得到修复。请下载最新版本的完整软...31.94* Posted at: 2 months ago -
#3837 windows完整版解压缩好了,打开报错...
💬 1[Last reply:2 months ago] 这是由于缺少必要的 VC++ 运行库组件导致的。下载并安装 Microsoft Visual C++ 可再发行组件包。下载地址:https://aka.ms/vs/17/release/vc_redist.x64.exe安装完成后,重启计算机,再次尝试运行 sp.exe。请查阅相关文档:常见错误与解决方法...157.254* Posted at: 2 months ago -
#3836 RuntimeError: Unable to open file 'model.bin' in model 'F:/softwares/win-pyvideotrans-v3.96-22/models/models--Systran--faster-whisper-large-v3'...
💬 1[Last reply:2 months ago] 这是由于 faster-whisper 模型文件下载不完整或损坏导致的。解决方案:手动下载 large-v3 模型文件。在软件根目录的 models 文件夹内,创建名为 models--Systran--faster-whisper-large-v3 的文件夹。访问模型下载地址:https://huggingface.co/Systran/faster-whisper-large-v3/tree/...162.141* Posted at: 2 months ago -
#3835 HTTPConnectionPool(host='127.0.0.1', port=9880): Max retries exceeded with url: /tts?text=%E8%BF%99%E4%BC%9A%E5%B0%86%E5%9B%BE%E5%83%8F%E5%90%91%E8%BE%B9%E7%BC%98%E6%8B%89%E4%BC%B8...
💬 1[Last reply:2 months ago] 这是由于本地 TTS 服务(如 F5-TTS、GPT-SoVITS 等)未启动或连接失败导致的。软件尝试连接 127.0.0.1:9880 进行配音,但该地址的服务未响应。解决方案:确认并启动 TTS 服务:根据您选择的配音渠道(例如 F5-TTS、GPT-SoVITS、CosyVoice 等),您需要先独立启动其对应的 API 服务。通常需要运行一个命令行窗口来启动服务,并确保服务地址为 htt...138.19* Posted at: 2 months ago -
#3832 安装发生错误,怎么解决,已经从网页上下载了,之后怎么操作...
💬 9[Last reply:2 months ago] 你的理解是正确的。错误信息显示 onnxruntime==1.23.2 仅支持 macosx_13_0_arm64 (即 Apple Silicon/M 芯片) 和 macosx_13_0_x86_64 (即 Intel 芯片但 macOS 13+)。你的系统是 macosx_12_0_x86_64,即 Intel 芯片的 macOS 12,两者都不满足要求。这是 macOS 源码部署在较旧 In...157.254* Posted at: 2 months ago -
#3834 4第607期 2006年研究:男人自慰时长等于实战时长吗?2026年02月27日17时37分09秒.mp4没有识别出字幕,请检查是否包含人类说话声音,以及说话语言是否和你选择的原始语言匹配...
💬 1[Last reply:2 months ago] 这是由于视频中的语音未被正确识别,可能原因包括:视频本身不含有效人声、背景噪音过大、原始语言选择错误,或语音识别模型/参数设置不当。请按以下步骤排查:检查视频音轨:使用播放器播放该视频,确认其中确实包含清晰的人声。如果视频本身不含音轨或人声被背景音乐完全覆盖,则无法识别。确认原始语言:在软件主界面的“发音语言”选项中,确保选择与视频中人声完全匹配的语言(例如,视频中是中文,则选择“中文”)。不要过...38.107* Posted at: 2 months ago -
#3833 TaskCfg(cache_folder=None, target_dir='E:/videotrans/output/translate', remove_noise=False, is_separate=False, detect_language=None, subtitle_language=None, source_language=None, t...
💬 1[Last reply:2 months ago] 这是由于配置了无效的网络代理地址,导致软件无法连接到 Google 翻译服务。在主界面的“网络代理地址”文本框中,清空所有内容。如果您没有可用的代理服务,请保持文本框为空。如果您有可用的代理,请确保地址格式正确(例如 http://127.0.0.1:10808),并且代理服务已启动。清空代理地址后,重新尝试翻译任务。请查阅相关文档:网络代理地址...2406:da18* Posted at: 2 months ago -
#3831 Could not parse response content as the length limit was reached - CompletionUsage(completion_tokens=4096, prompt_tokens=3666, total_tokens=7762, completion_tokens_details=None, pr...
💬 1[Last reply:2 months ago] 这是由于AI翻译渠道单次发送的字幕行数过多,导致AI模型的响应内容超过了其Token限制而无法完整返回。解决方案:在软件主界面,点击“菜单” -> “工具” -> “高级选项”。在“字幕翻译调整”区域,找到“AI翻译渠道每批字幕行数”设置项。将该数值减小(例如从默认的100改为30或20),以降低每次请求的Token消耗。同时,可以尝试取消勾选“发送完整字幕”和“AI翻译附带完整原字幕...211.20* Posted at: 2 months ago -
#3830 TaskCfg(cache_folder='D:/Program Files/win-pyvideotrans/tmp/13880/a3f3ef9b91', target_dir='C:/Users/Juno/Desktop/cuda-test/_video_out/5-中望3D演示操作要点讲解-PMI-Html-mp4', remove_noise=Fal...
💬 1[Last reply:2 months ago] This error occurs because you are trying to use the "Ali Qwen3-ASR" (阿里百炼 Qwen3-ASR) speech recognition channel without having purchased or activated the necessary API credits. This is a paid online s...116.6* Posted at: 2 months ago -
#3829 当前密钥没有访问权限,请检查权限设置 Error code: 403 - {'code': 30001, 'message': 'Sorry, your account balance is insufficient', 'data': None}...
💬 1[Last reply:2 months ago] 这是由于使用的AI翻译渠道(如OpenAI、DeepSeek等)账户余额不足或API密钥权限错误导致的。解决方案:检查账户余额:登录您所使用的AI平台(例如DeepSeek、OpenAI、智谱AI等)的账户控制台,确认账户余额或可用额度是否充足。检查API密钥:在pyVideoTrans软件中,点击 菜单 -> 翻译设置,找到您正在使用的AI翻译渠道(例如“DeepSeek AI”),检查填...220.130* Posted at: 2 months ago -
#3828 Application started at 2026-03-28 03:10:11 PIL\Image.py:116: RuntimeWarning: The _imaging extension was built for anothe......
💬 25[Last reply:2 months ago] 要获得更准确的泰语识别,同时使用 faster-whisper 模型,需要针对泰语优化配置,而不是单纯使用最大的模型。核心原因:faster-whisper 的 large-v3 模型虽然大,但对泰语等小语种并非最优,且默认参数可能不适合泰语语音特点。解决方案:优化高级参数配置(关键步骤):进入 菜单 -> 工具 -> 高级选项 -> 语音识别参数。进行如下针对性调整:语音阈值:...154.64* Posted at: 2 months ago -
#3827 Application started at 2026-03-28 02:39:39 PIL\Image.py:116: RuntimeWarning: The _imaging extension was built for anothe......
💬 3[Last reply:2 months ago] 这是由于模型文件下载不完整或损坏导致的。请手动下载并放置模型文件。删除指定目录:按照提示,删除 G:/VideoTrans/Trans/win-pyvideotrans-v3.98-327/models/models--Systran--faster-whisper-large-v3 这个文件夹。手动下载模型:访问模型下载页面:https://huggingface.co/Systran/fast...103.172* Posted at: 2 months ago -
#3826 TaskCfgVTT(is_cuda=True, uuid='390e4e6473', cache_folder='G:/VideoTrans/Trans/win-pyvideotrans-v3.98-327/tmp/36364/390e4e6473', target_dir='C:/Users/lsl/Downloads/_video_out/Namnun...
💬 1[Last reply:2 months ago] 这是由于显卡显存不足导致的。错误信息 CUDA failed with error out of memory 表明在使用 faster-whisper(本地) 的 large-v3 模型进行语音识别时,GPU 显存耗尽。解决方案:更换更小的语音识别模型:在主界面的语音识别渠道右侧,将模型从 large-v3 更换为 medium、small 或 base。large-v3 模型至少需要 10GB...103.172* Posted at: 2 months ago -
#3825 为什么3.98这个,语音识别不出来嘞。...
💬 3[Last reply:2 months ago] 从日志看,您已正确配置了CUDA加速(is_cuda=True),并选择了faster-whisper(本地)的large-v3模型来识别泰国语(source_language_code='th')。识别失败最可能的原因是模型未正确加载。请按以下步骤排查:检查模型文件:确认 large-v3 模型文件已完整下载到正确位置。前往软件安装目录下的 models 文件夹。检查是否存在...103.172* Posted at: 2 months ago -
#3824 语音识别阶段出错 [faster-whisper(本地)] 出错了,可能内存或显存不足A child process terminated abruptly, the process pool is not usable anymoreTr......
💬 1[Last reply:2 months ago] 这是由于内存或显存不足导致语音识别进程崩溃。解决方案:更换更小的识别模型:在语音识别渠道的下拉菜单中,将 large-v3 模型更换为 medium、small 或 base。large-v3 模型对显存/内存要求较高(建议显存 >10GB)。调整高级设置以降低资源占用:点击 菜单 -> 工具 -> 高级选项,在“语音识别参数”区域进行以下修改:CUDA数据类型:将 float3...31.223* Posted at: 2 months ago -
#3822 F5TTS._item_task() takes 2 positional arguments but 3 were given...
💬 1[Last reply:2 months ago] download it and override https://github.com/jianchang512/pyvideotrans/releases/download/v3.98/sp.exe...79.117* Posted at: 2 months ago -
#3823 requests.exceptions.ConnectionError: HTTPConnectionPool(host='127.0.0.1', port=9880): Max retries exceeded with url: /tts (Caused by NewConnectionError('<urllib3.connection.HTTPCon...
💬 1[Last reply:2 months ago] 这是由于 GPT-SoVITS 本地 TTS 服务未启动或 API 地址配置错误导致的。软件尝试连接 http://127.0.0.1:9880 但被目标计算机拒绝。解决方案:确保 GPT-SoVITS 服务已启动:你需要先独立运行 GPT-SoVITS 项目,并启动其 API 服务。请确保其服务终端窗口未关闭,且正在监听 127.0.0.1:9880 端口。检查 API 地址配置:在 pyVid...240e:3a1* Posted at: 2 months ago
Open source and free maintenance is not easy. If this project is helpful to you, please consider making a small donation to help the project continue to maintain and update.
Dondate: ko-fi.com/jianchang512