• #4281 不存在参考音频 D:/BaiduNetdiskDownload/f5-tts/ھەيز مىقدارىغا سەل قارىماڭ ھەيز مىقدارىڭىز ئاز بولسا باشقىلارغا قارىغاندا تېز ...
    💬 1
    [Last reply:5 hours ago] 这是因为 F5-TTS 等配音渠道要求参考音频必须放置在软件安装目录下的 f5-tts 文件夹内,而你指定的路径 D:/BaiduNetdiskDownload/f5-tts/... 无法被软件正确识别(该路径不存在或不在软件根目录下)。另外,参考音频文件名包含维吾尔/阿拉伯语字符,在 Windows 上极易因编码问题...
    2409:8a7c* Posted at: 5 hours ago
  • #4280 RuntimeError: {'message': 'tts failed', 'Exception': 'ICT.wav not exists'}...
    💬 3
    [Last reply:7 hours ago] 根本原因是 GPT-SoVITS 未能找到调用时所需的参考音频文件(ICT.wav),导致配音失败。检查 GPT-SoVITS API 服务状态 确保 GPT-SoVITS 的 API 服务已启动且可正常访问(默认 http://127.0.0.1:9880)。若服务未运行,软件无法完成配音。配置参考音频 如果配音...
    67.209* Posted at: 7 hours ago
  • #4278 Admin大神请进,有个关于术语表的问题请教...
    💬 28
    [Last reply:7 hours ago] 问题已解决。在提示词文件中保留 # ACTUAL TASK 标记,不要修改或删除,术语表会自动插入到该标记上方。现在你即可在 v3.99 中正常使用术语表功能,并结合 v3.98 的翻译风格。...
    2409:8a55* Posted at: 9 hours ago
  • #4279 为什么语音识别阶段老是识别一半就不干活了?...
    💬 1
    [Last reply:8 hours ago] 这是由于显存不足或资源分配冲突导致进程卡死,常见于使用大型模型(如 large-v3)且开启了多个并行任务。解决方案:取消“二次识别”:如果已勾选,请关闭,它会在配音后再跑一次识别,额外占用大量显存。使用更小模型:将语音识别模型改为 large-v3-turbo 或 medium(需至少 10GB 显存才能稳定运行 l...
    240e:355* Posted at: 8 hours ago
  • #4274 处理多个视频的时候,怎么限制同时并行的数量...
    💬 9
    [Last reply:10 hours ago] 暂无法确定 v3.99 术语表失效的具体原因,因为知识库未记录该版本的相关 bug。请提供软件安装目录下 logs/ 文件夹中最新日志文件的底部 30 行内容,以便进一步分析。同时请确认术语表文件编码为 UTF-8 无 BOM,并尝试重启软件后重试。...
    2409:8a55* Posted at: 10 hours ago
  • #4277 怎么源部署...
    💬 7
    [Last reply:10 hours ago] 根据日志可以确认 CUDA 已经启用。关键证据:日志中 is_cuda: True 表明软件已加载 CUDA 加速配置。GPU进程池:max_workers=1 表示 GPU 进程已启动。语音识别阶段耗时 41s(large-v3-turbo 模型),符合 GPU 加速下的速度。虽然日志没有直接输出 Using CUD...
    67.209* Posted at: 10 hours ago
  • #4276 RuntimeError: {'detail': 'Not Found'}...
    💬 1
    [Last reply:10 hours ago] 这是配音渠道的 API 服务返回了“404 Not Found”错误,通常是因为 API 地址或端口配置错误,或者对应的 TTS 服务未正确启动。请按以下步骤排查:确认配音渠道的 API 地址:在菜单 TTS设置 中检查填写的 API URL 是否完全正确(例如 F5-TTS 通常为 http://127.0.0.1:...
    2409:8d4c* Posted at: 10 hours ago
  • #4275 必须填写 appid access...
    💬 1
    [Last reply:10 hours ago] 这是因为你选择了需要付费密钥的翻译渠道(如百度翻译、腾讯翻译等),但没有在软件中进行配置。解决办法:点击顶部菜单 工具/选项 -> 翻译设置,找到你当前选择的翻译渠道对应的设置面板。在面板中填写正确的 AppID 和 Access Key(密钥需自行到对应平台申请)。如果你不想申请密钥,可以切换到免费翻译渠道(如...
    2a09:bac1* Posted at: 10 hours ago
  • #4273 KeyError: 'duration'...
    💬 1
    [Last reply:12 hours ago] 这是ffmpeg无法读取视频信息导致的,通常由文件损坏、路径过长或含特殊符号引起。检查视频文件:确保视频能正常播放,未被损坏。简化路径和文件名:将视频移动到短目录(如 D:\test)。重命名为不含中文、空格、特殊符号的简短英文名(例如 1.mp4)。检查编码格式:建议使用 H.264 编码的 MP4 文件,兼容性最好...
    107.173* Posted at: 12 hours ago
  • #4272 LLM重新断句是什么原理...
    💬 7
    [Last reply:14 hours ago] 这是配音参数设置不当导致的。请按以下顺序排查:降低配音语速和音量 在主界面点击“设置更多参数…”,将“配音语速”改为负数(如 -10 或 -20 表示减慢 10%~20%),并将“音量+”改为负值(如 -20 降低 20%)。过快的语速和过高的音量是破音最常见原因。更换配音角色 有些 TTS 角色在高音段或语速较快...
    2409:8a55* Posted at: 14 hours ago
  • #4271 LLM重新断句的提示词在哪改...
    💬 7
    [Last reply:15 hours ago] 在菜单栏 → 工具/选项 → 高级选项 → 语音识别参数部分,应有一个名为“断句模式”或“rephrase”的下拉/单选选项(可能显示为数字选择框)。可将其值设为 2 以启用自动修正(同时也会进行LLM重新断句)。如果界面中确实没有任何相关选项,可能是软件版本UI差异,建议手动修改配置文件(通常位于软件目录下的vide...
    2409:8a55* Posted at: 15 hours ago
  • #4270 有些字发音不正确,比如3ds,中文翻译成3毫秒...
    💬 7
    [Last reply:15 hours ago] 是的,如果术语表配置为 3ds=3ds(游戏平台),那么在翻译后的字幕文本中会包含“3ds(游戏平台)”这一完整内容,配音时将完整读出“3ds(游戏平台)”。 如果不想让括号里的说明被配音读出,只需将术语表改为 3ds=3ds 即可,这样翻译时会保留原文“3ds”,配音时也只读“3ds”。...
    2409:8a55* Posted at: 15 hours ago
  • #4269 语音识别的提示词在哪设置...
    💬 3
    [Last reply:17 hours ago] 在“Whisper模型提示词”设置中,写法和目的分为两种:热词:以英文逗号分隔单词,告诉模型这些词容易出现。例如:深度学习,人工智能,卷积神经网络上下文提示:写一个完整短语,描述视频的主题或说话风格,可提高特定领域识别率。例如:这是一段关于医学讲座的录音,重点关注专业术语和数字。请参考文档中的具体设置位置:高级设置各个...
    2409:8a55* Posted at: 17 hours ago
  • #4268 音色文件本身是不是也有隐性的温度值?...
    💬 5
    [Last reply:17 hours ago] 在勾选了“对齐字幕声音”但未启用“配音加速”或“视频慢速”时,如果某条配音音频时长超过其对应的字幕时间,软件会强制将字幕时间轴缩短以匹配该音频的实际时长,这可能导致下一条字幕的开始时间前移,从而使得前后两条配音音频在时间轴上出现重叠。为避免这种情况,建议同时启用“配音加速”或“移除字幕间静音”选项。请查阅相关文档:视频...
    2409:8a55* Posted at: 17 hours ago
  • #4267 温度值设置支持0.15和0.125这样的值吗?...
    💬 1
    [Last reply:17 hours ago] 知识库中未明确说明温度值支持小数的具体范围,但通常AI模型温度值是一个0到1之间的浮点数,0.15和0.125属于合理范围。你可以直接在软件界面的“菜单 -> 工具/选项 -> 高级选项 -> 字幕翻译调整”中修改该值尝试,如果遇到报错请提供日志。...
    174.139* Posted at: 17 hours ago
  • #4259 [DEBUG] result={'visible': True, 'value': 'C:\Users\Admin\AppData\Local\Temp\gradio\b63dccf3804fc531779443a72840298a1eb1...
    💬 27
    [Last reply:20 hours ago] 无法手动修改,translate_type 是软件根据当前选择的翻译渠道自动生成的,手动改配置文件不会生效且可能导致异常。从你的描述来看,问题根源很可能是软件识别 DeepSeek 渠道的代码存在 bug 或安装包版本与渠道定义不匹配,导致无论你选什么 AI 翻译渠道,内部都错误地映射为传统渠道(值为4)。既然已经完整...
    2409:8a55* Posted at: 1 day ago
  • #4266 TaskCfgVTT(is_cuda=True, uuid='a7b0810154', cache_folder='F:/win-pyvideotrans-v3.99-418/tmp/32316/a7b0810154', target_di...
    💬 1
    [Last reply:1 day ago] 这是由于 CUDA 运行失败导致的,常见原因有显卡驱动过旧、CUDA 版本不兼容、显存不足或 GPU 被其他程序占用。解决步骤:确认 CUDA 环境:确保已安装 CUDA 12.8 和 cuDNN 9.11+。可在 CMD 中运行 nvcc -V 查看版本,nvidia-smi 查看显卡驱动和可用显存。降低显存占用(按...
    119.237* Posted at: 1 day ago
  • #4265 TaskCfgVTT(is_cuda=True, uuid='17f1a08bbe', cache_folder='D:/win-pyvideotrans-v3.95/tmp/11616/17f1a08bbe', target_dir='F...
    💬 1
    [Last reply:1 day ago] 这是由于显存不足导致进程崩溃。您的日志显示已启用二次识别(recogn2pass=True),这会额外占用大量显存。解决方案:立即取消二次识别:在主界面取消勾选“二次识别”选项,然后重新尝试。如仍不足:将语音识别模型从 large-v3-turbo 切换为更小的模型(如 medium 或 small)。调整高级选项:在...
    36.142* Posted at: 1 day ago
  • #4263 E:\AI_Tools\pyvideotrans>.venv\Scripts\python.exe -c "import torch; print(f'识别显卡: {torch.cuda.is_available()}'); prin...
    💬 19
    [Last reply:1 day ago] 在软件主界面勾选 CUDA加速 后,开始语音识别(如 faster-whisper)时,你可以打开任务管理器(Ctrl+Shift+Esc)-> 性能 -> GPU,观察 GPU 利用率是否上升。如果 GPU 有负载,说明正常调用了显卡。也可以查看 logs 日志,搜索 “CUDA” 确认有相关提示。...
    192.243* Posted at: 1 day ago
  • #4264 打轴字幕样式如何设定?...
    💬 3
    [Last reply:1 day ago] 翻译完成后没有弹出确认窗口直接合成,最常见的原因是您当前处于批量处理模式(勾选了主界面上的“文件夹”选项)或未选择单个视频。单视频交互模式仅在处理单个视频时才会在识别后、翻译后、配音后弹出编辑窗口。如果您需要手动调整字幕和配音,请确保只拖入一个视频,且不勾选“文件夹”复选框。如果确认是单视频模式但仍未弹出,可能是软件配...
    5.34* Posted at: 1 day ago
Open source and free maintenance is not easy. If this project is helpful to you, please consider making a small donation to help the project continue to maintain and update.

Related resource