-
#3083 语音识别降噪,faster模型large-v3不可以用吗,2小时语音识别视频,就是识别不出来,如何弄...
💬 7[Last reply:12 days ago] 分离人声功能在软件的“工具箱”中。操作步骤如下:打开软件,点击顶部菜单栏的“工具箱”。在工具箱界面中,找到并点击“分离人声”按钮。在弹出的文件选择窗口中,选择你想要处理的视频或音频文件。软件将使用内置模型分离出人声和背景音乐,并生成两个独立的音频文件。分离完成后,你可以在输出目录(默认是 _video_out 文件夹)...117.188* Posted at: 12 days ago -
#3082 RuntimeError: Unable to open file 'model.bin' in model 'D:/8_Tools/trans/models/models--Systran--faster-whisper-large-v2...
💬 1[Last reply:12 days ago] 这是由于 faster-whisper 模型文件下载不完整或损坏导致的。手动下载模型文件:前往 HuggingFace 模型页面下载完整的 faster-whisper-large-v2 模型文件。将下载的模型文件(应包含 config.json, model.bin, tokenizer.json 等)放置到正确的目...113.108* Posted at: 12 days ago -
#3081 把GPT-SoVITS接入pyVedioTrans后加载模型,两个不同音色趋于相同怎么回事。终端加载信息如下:F:\ai\GPT-SoVITS-v2pro-20250604>.\runtime\python api_v2.py-TTS...
💬 1[Last reply:12 days ago] 这是由于 GPT-SoVITS 模型加载时出现了权重不匹配(IncompatibleKeys),导致模型可能无法正确区分不同音色。根据终端日志,模型加载时报告了大量 missing_keys,这表明你加载的 SoVITS 模型权重文件(马保国_e8_s800.pth)与当前运行的 GPT-SoVITS API 版本(v...240e:341* Posted at: 12 days ago -
#3080 TaskCfg(cache_folder='D:/Program Files/win-pyvideotrans-v3.96/tmp/12268/140f727615', target_dir='E:/DownLoads/DCL/_video...
💬 1[Last reply:12 days ago] 这是由于本地 openai-whisper 模型在 GPU 推理时出现了数值溢出(NaN)错误,通常与模型文件损坏或 GPU 驱动/环境问题有关。解决方案:清理并重新下载模型:删除 models/ 目录下与 openai-whisper 相关的模型文件夹(例如 models--openai--whisper-large...240e:44d* Posted at: 12 days ago -
#3079 TaskCfg(cache_folder='D:/Program Files/win-pyvideotrans-v3.96/tmp/10952/8462c0143a', target_dir='E:/DownLoads/DCL/_video...
💬 1[Last reply:12 days ago] 这是由于 openai-whisper 模型在处理时产生了 NaN(非数字)值,通常与模型文件损坏、显存不足或 CUDA 环境问题有关。清理并重新下载模型:删除 models/whisper/ 目录下的 large-v3-turbo 模型文件夹,然后重启软件让其重新下载。检查 CUDA 环境:确保已正确安装 CUDA ...240e:44d* Posted at: 12 days ago -
#3078 用语音转录没有效果,没有转录,用的large-v3,一点都没有动,...
💬 15[Last reply:13 days ago] 不是。正确的操作是:将补丁包解压,然后把解压出来的所有文件和文件夹,复制并粘贴到你已经解压好的完整版软件根目录中,当系统提示“是否替换目标中的文件”时,选择“替换”。关键步骤:确保你已经将完整版软件包(例如 win-pyvideotrans-v3.96-22.7z)解压到一个目录(如 D:\pyVideoTrans)。...103.172* Posted at: 13 days ago -
#3070 配音全部失败 403, message='Invalid response status', url='wss://speech.platform.bing.com/consumer/speech/synthesize/readaloud/...
💬 7[Last reply:13 days ago] 根据现有文档无法确定具体原因。请提供软件安装目录下的 logs/ 文件夹中最新的日志文件(复制底部约30行报错信息)以便分析。...2408:847a* Posted at: 13 days ago -
#3077 User location is not supported for the API use....
💬 1[Last reply:13 days ago] 这是由于您使用的API服务(如Edge-TTS)检测到您所在的地理位置不被支持。请按以下步骤解决:检查并更换配音渠道:在软件主界面,切换到“配音渠道”设置,尝试更换为其他不受地理位置限制的渠道,例如:F5-TTS(需本地部署)CosyVoice(需本地部署)GPT-SoVITS(需本地部署)Qwen-TTS(本地)(需...159.65* Posted at: 13 days ago -
#3076 google.genai.errors.ClientError: 429 RESOURCE_EXHAUSTED. {'error': {'code': 429, 'message': 'You exceeded your current q...
💬 1[Last reply:13 days ago] 这是由于 Gemini TTS 免费配额已用尽导致的。错误信息显示你使用的 gemini-2.5-flash-tts 模型的免费层级请求配额(每天10次)已超过。解决方案:检查配额与账单:访问 Google AI Studio 或 Google Cloud Console,查看你的 Gemini API 使用情况和配额...38.150* Posted at: 13 days ago -
#3075 v3.96版本配音结束导出的视频字幕时间戳对不上,还会出现字幕不完整,视频出现重复片段的情况...
💬 3[Last reply:13 days ago] 这是因为你的软件版本或界面显示可能未完全加载或存在缓存。在 pyVideoTrans 中,“自动切除静音片段”功能通常位于“高级选项” -> “音画对齐”设置内,与“配音加速”和“视频慢速”并列。解决方案:检查高级选项:在视频翻译任务界面,点击“高级选项”按钮,在弹出的设置窗口中,仔细查找“音画对齐”或“配音设置...2408:8226* Posted at: 13 days ago -
#3074 pyimod03_ctypes.install.<locals>.PyInstallerImportError: Failed to load dynlib/dll 'C:\\softwares\\win-pyvideotrans-v3.9...
💬 1[Last reply:13 days ago] 这是由于系统缺少必要的 VC++ 运行库或软件文件不完整,导致 Azure TTS 模块所需的 Microsoft.CognitiveServices.Speech.core.dll 动态链接库无法加载。安装 Microsoft Visual C++ 可再发行组件:这是最可能的原因。请下载并安装微软官方的最新 VC++...109.166* Posted at: 13 days ago -
#3073 TaskCfg(cache_folder='G:/VideoTrans/Trans/win-pyvideotrans-v3.96-22/tmp/14232/4f437afe21', target_dir='G:/VideoTrans/Tra...
💬 1[Last reply:13 days ago] 这是由于本地 faster-whisper 模型文件缺失或损坏导致的。软件在指定路径 G:/VideoTrans/Trans/win-pyvideotrans-v3.96-22/models/models--Systran--faster-whisper-large-v3 下找不到 model.bin 文件。解决方案:...103.172* Posted at: 13 days ago -
#3072 必须选择视频文件=system:Windows-10-10.0.19043-SP0version:v3.96frozen:Truelanguage:zhroot_dir:D:/新建文件夹...
💬 1[Last reply:13 days ago] 这是由于软件无法识别到有效的视频文件导致的。请检查您选择的文件是否为视频格式,以及文件路径是否符合规范。检查文件格式:确保您选择的文件是常见的视频格式(如 .mp4, .avi, .mkv, .mov 等)。软件不支持纯音频文件(如 .mp3)或图片文件。检查文件路径:根据您的日志,软件安装在 D:/新建文件夹。路径中...2408:8221* Posted at: 13 days ago -
#3071 3.96版本,对齐控制选择视频慢速,最终视频会有片段重复播放卡顿现象...
💬 3[Last reply:13 days ago] 问题核心在于“视频慢速”对齐模式在当前版本(3.96)的实现逻辑可能存在调整,导致帧处理不如旧版本(3.76)平滑,从而产生重复和卡顿。解决方案:临时回退或对比验证:如果3.76版本对您的工作流至关重要且无此问题,可以考虑暂时使用3.76版本处理需要“视频慢速”模式的视频,以完成当前任务。提供详细反馈:为了帮助开发者定...223.90* Posted at: 13 days ago -
#3069 RuntimeError: Unable to open file 'model.bin' in model 'G:/VideoTrans/Trans/win-pyvideotrans-v3.96-22/models/models--Sys...
💬 1[Last reply:13 days ago] 这是由于 faster-whisper 模型文件 model.bin 缺失或下载不完整导致的。解决方案:手动下载模型文件:由于网络问题,自动从 HuggingFace 下载可能失败。你需要手动下载模型文件。下载地址:访问 https://huggingface.co/Systran/faster-whisper-lar...117.188* Posted at: 13 days ago -
#3068 不存在参考音频 I:/win-pyvideotrans-v3.96-22/f5-tts/2...
💬 1[Last reply:13 days ago] 这是由于在配置 F5-TTS 配音渠道时,选择了 clone 角色或指定了参考音频,但对应的参考音频文件不存在或路径错误。检查配音设置:在视频翻译任务的“配音设置”或“多角色配音”配置中,确认你为某个说话人选择了 clone 角色,并检查其“参考音频”文件路径是否正确。软件提示的路径是 I:/win-pyvideotr...240e:b8f* Posted at: 13 days ago -
#3067 403, message='Invalid response status', url='wss://speech.platform.bing.com/consumer/speech/synthesize/readaloud/edge/v1...
💬 1[Last reply:13 days ago] 这是由于 Edge-TTS 服务端限流或网络连接问题导致的 403 错误。解决方案:在软件主界面,点击菜单栏的“工具” -> “高级选项”。在“高级选项”窗口中,找到“配音设置”区域。将“同时配音线程数”设置为 1。将“配音后暂停秒数”设置为 5 到 10 秒。点击“保存”并重启软件,然后重试任务。如果问题依旧,...50.7* Posted at: 13 days ago -
#3066 TaskCfg(cache_folder='E:/win-pyvideotrans-v3.92/tmp/8752/b087da145a', target_dir='E:/win-pyvideotrans-v3.92/output/recog...
💬 1[Last reply:13 days ago] 这是由于 FFmpeg 在处理音频文件时发生致命错误,导致进程异常退出(错误码 3221225501)。此错误通常与系统环境、FFmpeg 版本或音频文件本身有关。解决方案:检查音频文件:确认 C:/Users/istrator/Desktop/3.mp3 文件是否完整、可正常播放。尝试使用其他音频文件测试。...2409:8a3c* Posted at: 13 days ago -
#3065 TaskCfg(cache_folder='E:/win-pyvideotrans-v3.92/tmp/1712/8fc385c12c', target_dir='E:/win-pyvideotrans-v3.92/output/recog...
💬 1[Last reply:13 days ago] 这是由于 FFmpeg 在处理音频文件时发生严重错误(退出码 3221225501)导致的。此错误通常与系统环境、FFmpeg 版本或音频文件本身有关。解决方案:检查 FFmpeg 完整性:确保您使用的是完整版软件包,且 ffmpeg/ 目录下的文件未被误删或损坏。如果下载的是补丁包,请重新下载完整版。检查音频文件:尝...2409:8a3c* Posted at: 13 days ago -
#3064 使用阿里百炼ASR做语音识别模型时必现网络连接失败(已尝试墙内外都不行)但是设置中的翻译测试可通过...
💬 1[Last reply:13 days ago] 这是由于阿里百炼ASR服务在上传音频文件到其OSS(对象存储)时网络连接被中断导致的。根据错误堆栈,问题发生在 dashscope.utils.oss_utils.py 的 upload 函数中,具体是 requests.exceptions.ConnectionError: ('Connection abo...23.177* Posted at: 13 days ago
Open source and free maintenance is not easy. If this project is helpful to you, please consider making a small donation to help the project continue to maintain and update.