-
#4771 videotrans.configure.excepts.DubbingSrtError: 必须传入参考音频文件路径...
💬 1[Last reply:1 hour ago] 该错误是因为使用的配音渠道(如 F5-TTS、CosyVoice、OmniVoice 等)需要参考音频进行声音克隆,但未提供或配置不正确。解决方案:确保参考音频文件存在:在软件根目录下的 f5-tts/ 文件夹中,放入一个 3-10秒的 .wav 格式 的参考音频文件(例如 myvoice.wav)。如果没有现成的,可...2409:8a7a* Posted at: 1 hour ago -
#4770 TaskCfgVTT(is_cuda=True, uuid='58fd08ac83', cache_folder='K:/MACHI/win-pyvideotrans-v3.99-428/tmp/17104/58fd08ac83', tar...
💬 1[Last reply:2 hours ago] 错误核心原因是 FFmpeg 从视频中分离音频轨道的步骤失败。常见原因如下:1. 文件路径/名称包含特殊字符或过长你的输入路径包含空格、点、短横线、中文(Udemy - Unreal Course - Zero to Pro)等。Windows 命令行下这类字符可能导致 FFmpeg 无法正确解析路径,从而报“分离音频...183.14* Posted at: 2 hours ago -
#4769 语音识别阶段出错 [faster-whisper(本地)] 出错了,可能内存或显存不足 Model:large-v3-turbo GPU0Traceback (most recent call last): File "D:\GitClo...
💬 1[Last reply:2 hours ago] 这是由于显存不足导致 Faster-Whisper 子进程被系统强制终止。large-v3-turbo 模型通常需要 6-8GB 以上显存,当前显卡(GPU0)可能无法满足。请按以下顺序尝试解决:更换更小的模型:在语音识别渠道中将模型改为 medium、small 或 base,降低显存需求。调整高级设置降低显存占用:...72.56* Posted at: 2 hours ago -
#4768 LLM重新断句一直失效...
💬 3[Last reply:3 hours ago] DeepSeek 是国产 AI 模型,其 API(api.deepseek.com)在国内可以直接访问,通常无需配置网络代理。请将软件主界面的“网络代理地址”文本框保持留空。如果你所在网络环境(如公司内网、校园网)限制了外部 API 访问,必须使用代理的话,格式为 http://127.0.0.1:端口号(例如 htt...183.14* Posted at: 4 hours ago -
#4767 TaskCfgSTT(uuid='4d27f9aac5', name='N:/Gwenmedia.mp4', dirname='N:/', noextname='Gwenmedia', basename='Gwenmedia.mp4', e...
💬 1[Last reply:5 hours ago] 错误直接原因是 faster-whisper 未从音频中识别出任何内容,常见于三种情况:原音频/视频文件无声或语音被强噪音淹没原始语言选择错误(此处自动检测到 en,但若实际不是英语,模型可能无法识别)模型过小或音频格式不兼容请按顺序尝试以下步骤:1. 验证音频有效性 用其他播放器打开 N:/Gwenmedia.mp...124.165* Posted at: 5 hours ago -
#4766 TaskCfgSTT(uuid='4d27f9aac5', name='N:/Gwenmedia.mp4', dirname='N:/', noextname='Gwenmedia', basename='Gwenmedia.mp4', e...
💬 1[Last reply:6 hours ago] 转录结果为空的核心原因是使用了tiny模型,此模型极小但准确度极低,无法从音频中有效提取任何文字,尤其在没有GPU加速(is_cuda=False)时更难完成任务。解决方案:更换更大的模型:在语音识别渠道中选择 base、small、medium 或 large-v3,避免使用 tiny。开启降噪:在主界面选中 降噪 ...124.165* Posted at: 6 hours ago -
#4765 TaskCfgSTT(uuid='850c81b7b9', name='N:/K/flv/GwenMedia/Gwenmedia - Pain b4 Pleasure (q1).mp4', dirname='N:/K/flv/GwenMed...
💬 1[Last reply:6 hours ago] 该错误通常由以下原因之一引起:视频文件路径或名称包含特殊符号(括号、空格、破折号等),导致 ffmpeg 无法正确提取音频;或 模型选择不当(medium.en 仅支持纯英语,且无 CUDA 加速时可能因资源不足而超时)。解决方案:简化视频文件名和路径:将视频重命名为纯英文、数字、下划线的短名称,例如 Gwenmedi...124.165* Posted at: 6 hours ago -
#4764 TaskCfgVTT(uuid='ec8adacf0e', name='D:/Steam/steamapps/workshop/content/431960/3731843020/鬼妈妈 real 4K 60FPS 中文字幕.mp4', d...
💬 1[Last reply:6 hours ago] 该错误表示语音识别过程未返回任何结果。根据日志分析,最可能的原因是:1. 模型选择错误:您使用的模型是 small.en(仅支持纯英语音频)。如果视频中的原始语音包含中文或其他语言,该模型将无法识别任何内容,直接返回空结果。2. 文件路径问题:视频文件 鬼妈妈 real 4K 60FPS 中文字幕.mp4 包含中文、空...2409:8a30* Posted at: 6 hours ago -
#4763 TaskCfgSTT(uuid='850c81b7b9', name='N:/K/flv/media - Pleasure.mp4', dirname='N:/K/flv/', noextname='Pleasure, basename='...
💬 1[Last reply:7 hours ago] 这是由于系统内存不足(或显存不足)无法加载 large-v3 模型导致的。您的 is_cuda=False 表明未使用显卡加速,此时 faster-whisper 依赖 CPU 和系统内存,而 large-v3 模型在 CPU 模式下需要大量 RAM(通常建议 16GB 以上)。解决方法:切换为更小模型:在语音识别渠道...124.165* Posted at: 7 hours ago -
#4762 TaskCfgSTT(uuid='850c81b7b9', name='N:/K/flv/GwenMedia/Gwenmedia - Pain b4 Pleasure (q1).mp4', dirname='N:/K/flv/GwenMed...
💬 1[Last reply:7 hours ago] Error 信息为 None,表明在调用阿里 FunASR 本地模型时,子进程启动或模型加载阶段返回了空值,未捕获到具体错误内容。可能原因:模型文件未成功下载或损坏:阿里 FunASR 模型首次使用需联网自动下载,若网络不通或下载中途中断,会导致模型缺失。系统环境缺少依赖:FunASR 依赖某些动态库,若系统缺失可能导...124.165* Posted at: 7 hours ago -
#4761 TaskCfgVTT(uuid='afaabb1bd9', name='C:/Users/Administrator/Desktop/Unreal Engines Gameplay Ability System — Part 1 The S...
💬 1[Last reply:7 hours ago] 这是由于百度翻译 API 返回“Invalid Sign”(无效签名)导致的错误,说明你在软件中配置的百度翻译 APP ID 和 密钥 不匹配或填写有误。解决方案:点击菜单栏 “翻译设置” → 找到 百度翻译 设置面板。重新确认并填写正确的 APP ID 和 密钥(注意不要有多余空格)。建议重新生成密钥后再粘贴上去,确...167.253* Posted at: 7 hours ago -
#4760 语音识别中文语音,有背景音乐,哪个模型识别效果做好?...
💬 1[Last reply:7 hours ago] 针对中文语音且存在背景音乐的场景,推荐使用 qwen-asr(本地) 或 阿里FunASR(本地)+paraformer-zh 模型,并务必开启降噪或人声背景分离功能来消除背景干扰。在“语音识别”下拉框中选择 qwen-asr(本地)(首次运行需联网下载模型)。在主界面右上角勾选 降噪,或点击“设置更多参数”勾选 分离...167.172* Posted at: 7 hours ago -
#4759 TaskCfgVTT(uuid='3bd8688cba', name='C:/Users/81152/Downloads/抖音下载/20250821_【新界开荒】01集_7541023436731206922.mp4', dirname='...
💬 1[Last reply:7 hours ago] 这是由于本地模型文件的 SHA256 校验失败,通常是因为下载中断或文件损坏导致的。删除损坏的模型文件:关闭软件,进入软件根目录下的 models/ 文件夹,删除与报错中模型名称(openai-whisper 的 large-v3)对应的文件夹(通常是 models--Systran--faster-whisper-l...167.172* Posted at: 7 hours ago -
#4758 TaskCfgVTT(uuid='afaabb1bd9', name='C:/Users/Administrator/Desktop/Unreal Engines Gameplay Ability System — Part 1 The S...
💬 1[Last reply:8 hours ago] 错误核心原因:网络代理配置错误。您在翻译渠道选择的是“微软(免费)”,该服务在国内无需代理即可访问,但您在主界面“网络代理地址”中填写了内容(或配置错误),导致请求时SSL连接受阻并报“No such file or directory”。解决方案:清空网络代理地址:回到软件主界面,找到“网络代理地址”输入框,删除所有...167.253* Posted at: 8 hours ago -
#4757 视频口型和音频对不上,有办法改善吗?...
💬 1[Last reply:9 hours ago] 配音后口型和音频对不上,是因为不同语言的音节数和语法结构差异导致配音时长变化,从而产生偏移。改善方法:勾选“音频加速”:强制加速配音匹配原时长(适用于短时偏移)。勾选“视频慢速”:放慢视频片段等待配音播放(较耗时,体积增大)。启用“二次识别”:单硬字幕时勾选,配音后重新转录生成精确对齐的字幕。调整语速/音量:在“设置更...128.241* Posted at: 9 hours ago -
#4756 如果用分离背景音然后再和成,会有杂音是什么情况...
💬 3[Last reply:9 hours ago] 这是由于软件内置的人声分离模型(UVR-onnx)精度有限,且仅支持 CPU 运算,在处理复杂背景音乐时容易残留人声或产生失真,重新合成后表现为杂音。 若希望保留原视频的片头背景音乐,不建议使用软件内置的分离功能,而是改用专业的外部工具(如 UVR5-GUI)分离出高质量的背景声文件,然后手动导入软件使用。具体操作步...2a14:4900* Posted at: 9 hours ago -
#4755 HTTPSConnectionPool(host='translate.google.com', port=443): Max retries exceeded with url: /m?sl=zh-cn&tl=en&hl=en&q=%E4...
💬 1[Last reply:9 hours ago] 这是由于你在主界面的“网络代理”字段填写了代理地址,但该代理服务未运行或地址错误导致连接被拒。解决方案:如果不需要使用代理(例如国内使用Google翻译才需代理),必须将主界面的“网络代理”文本框保持完全空白。如果需要借助代理访问Google翻译,请检查代理是否已启动(如Clash/V2Ray),并确认地址格式正确,例...128.241* Posted at: 9 hours ago -
#4753 File model.bin is incomplete: failed to read a buffer of size 13107200 at position 590811106,Traceback (most recent call...
💬 3[Last reply:11 hours ago] 这是由于系统内存(RAM)或 GPU 显存不足导致的 mkl_malloc 分配失败。常见于使用 large-v3 等大模型且同时运行其他高内存任务时。请按以下顺序尝试解决:关闭其他占用内存/显存的程序(如浏览器、视频编辑器、其他AI服务)。缩小 ASR 模型:在主界面将语音识别模型从 large-v3-turbo 切...128.241* Posted at: 12 hours ago -
#4754 videotrans.configure.excepts.DubbingSrtError: TTS speak request failed, please verify your input and ensure the service ...
💬 1[Last reply:12 hours ago] 这个错误是由于TTS(语音合成)请求失败导致的。可能原因包括:所选配音渠道服务未启动、网络连接异常、参考音频文件缺失或格式不兼容、请求参数配置错误(如并发过高触发限流)。请按以下步骤排查:确认配音渠道服务是否正常运行若使用 Edge-TTS(免费):检查网络连接,避免高并发(可在“高级选项”中将并发数设为1,请求间隔设...39.158* Posted at: 12 hours ago -
#4749 我想问一下,你们的批量生成视频,是什么流程:比如第一个视频,识别 翻译 生成语音 合并输出 然后下一个视频。还是说,所有的视频,先统一识别,然后统一翻译,统一生成语音,统一输出,是哪种模式?...
💬 23[Last reply:14 hours ago] 字幕提前消失的原因是:翻译后的配音时长超过原始语音时长,而字幕时间轴仍沿用原始语速的起止时间,因此配音未播完字幕已消失。解决方法:在主界面右上角勾选二次识别(仅适用于单硬字幕)。该选项会在配音完成后对配音文件再次进行 ASR 转录,生成与配音精确对齐的新字幕,从而消除时长偏差。确保字幕类型选为嵌入硬字幕(单硬字幕)。若...2a14:4900* Posted at: 1 day ago
Open source and free maintenance is not easy. If this project is helpful to you, please consider making a small donation to help the project continue to maintain and update.