• #4146 能兼容调用UVR5 - MDX23C-InstVoc HQ模型吗?...
    💬 4
    [Last reply:54 minutes ago] 核心原因是软件内置的人声分离模型(UVR)效果可能不如你期望的 UVR5 - MDX23C-InstVoc HQ 模型。根据开发者回复,软件主界面“设置更多参数”中勾选的“分离人声背景声”,默认使用的就是 UVR 模型。如果你已启用此选项但效果仍不理想,说明当前内置的模型分离能力不足以完全滤除你视频中的背景音乐干扰。解...
    142.202* Posted at: 10 hours ago
  • #4150 Permission denied: C:/Users/Solofo/Documents/test/YouTube Killed Shorts - WAN Show April 17, 2026.mp3...
    💬 1
    [Last reply:2 hours ago] This error occurs because the file path contains special characters (like ?) or is too long, which is not compatible with Windows command-line operations (used ...
    78.120* Posted at: 2 hours ago
  • #4149 什么是传统翻译每次字幕行数,和AI翻译有什么区别...
    💬 3
    [Last reply:7 hours ago] 单词或短语被拆分为两条字幕并出现连字符,通常是语音识别(ASR)模型在处理音频时,根据静音或语音活动检测(VAD)参数进行强制分割的结果。核心原因:语音识别模型(如Whisper)将连续的音频流切割成片段进行识别。当某个单词或短语的发音恰好跨越了两个音频片段的切割点时,模型可能会将其识别为两部分,并在中间插入连字符“-...
    2409:8a55* Posted at: 8 hours ago
  • #4148 短视频相比长视频,翻译最终结果的质量和准确率是不是要差很多,特别是同一段话,在长视频中跟随全部内容翻译下来,问题会很少,但如果单独截出来,成为一短短视频,再翻译就会错误连篇,各种不通顺,为什么...
    💬 7
    [Last reply:8 hours ago] 是否开启“启用上下文感知”取决于你的硬件条件和需求,它是一把双刃剑。开启(推荐有条件时开启):优点:能显著提升语音识别(特别是Whisper系列模型)的准确性和连贯性,因为模型会参考前后的音频内容来理解当前片段。缺点:会占用更多GPU显存,处理速度可能略有下降,并且在某些情况下(如音频质量差、背景音复杂)可能增加“幻觉...
    2409:8a55* Posted at: 8 hours ago
  • #4147 老外总是大喘气,所以经常断句成半句话...
    💬 1
    [Last reply:9 hours ago] 这是由于语音识别模型在分割语音片段时过于敏感,将自然停顿或换气识别为句子边界导致的。解决方案:调整语音识别参数:点击顶部菜单栏的 工具/选项 -> 高级选项,在“语音识别参数”区域进行如下修改:静音分割持续毫秒:将此值从默认的 500 增大,例如设为 800 或 1000。这会让软件在更长的静音后才进行分割,从而...
    2409:8a55* Posted at: 9 hours ago
  • #4145 RuntimeError: 40e14458f5 split no voice error:opening input: No such file or directory opening input file -hwaccel. open...
    💬 1
    [Last reply:10 hours ago] 这是由于视频文件路径过长或包含特殊字符,导致 ffmpeg 命令执行失败。重命名并移动视频文件:将待处理的视频文件重命名为一个简短的英文或数字名称(例如 video.mp4),并将其移动到较浅的目录下(例如 D:\videos)。检查软件路径:确保 pyVideoTrans 软件本身也安装在路径简短且不含中文或特殊符号...
    103.172* Posted at: 10 hours ago
  • #4144 TaskCfgSTT(is_cuda=True, uuid='0f4c8160a8', cache_folder='D:/xiazai/win-pyvideotrans-v3.98-0410/tmp/16640/0f4c8160a8', t...
    💬 1
    [Last reply:10 hours ago] 这是由于显存或内存不足导致语音识别进程崩溃。错误信息明确指出“可能内存或显存不足 Model:large-v3-turbo GPU0”。虽然之前使用正常,但处理不同视频时(如更长、更复杂的音频)或系统后台有其他程序占用资源,都可能突然触发此问题。解决方案:降低模型规格:在语音识别渠道的下拉菜单中,将模型从 large-...
    240e:38c* Posted at: 10 hours ago
  • #4143 HTTPSConnectionPool(host='edge.microsoft.com', port=443): Max retries exceeded with url: /translate/auth (Caused by Prox...
    💬 1
    [Last reply:13 hours ago] 这是由于网络代理配置错误或代理服务未启动导致的。软件尝试通过代理连接微软翻译服务,但代理服务器无法连接。解决方案:检查代理服务状态:确保你的 VPN 或代理客户端正在运行。核对代理地址:在软件主界面的“网络代理地址”文本框中,确认你填写的地址和端口是否正确。格式应为 http://127.0.0.1:端口号(例如 ht...
    183.192* Posted at: 13 hours ago
  • #4142 requests.exceptions.ProxyError: HTTPSConnectionPool(host='dev.microsofttranslator.com', port=443): Max retries exceeded ...
    💬 1
    [Last reply:14 hours ago] 这是由于网络代理设置错误或代理服务未启动导致的。软件尝试通过您设置的代理连接微软翻译服务,但代理服务器拒绝了连接。解决方案:检查您的代理客户端(如VPN、Clash等)是否已成功启动并正常运行。确认您在软件“网络代理地址”文本框中填写的地址和端口号是否正确。格式通常为 http://127.0.0.1:端口号。如果您没...
    123.88* Posted at: 14 hours ago
  • #4141 识别说话人后并没有标记角色...
    💬 5
    [Last reply:15 hours ago] 根据日志,问题已明确:说话人分离模型(阿里cam++)已成功运行并返回了结果(识别出多个说话人ID:0, 1, 2, 3, 4),但后续处理中,这些说话人标记未能成功关联并写入到最终的字幕文件。日志显示“识别出个 0 说话人”是格式错误,实际已识别出多个ID。核心原因是:在“翻译视频或音频”的流程中,说话人分离产生的时...
    182.107* Posted at: 16 hours ago
  • #4139 二次语音识别,识别出的字幕的字数有什么需要注意的吗...
    💬 9
    [Last reply:16 hours ago] 日志中没有“术语表”或“glossary”关键词,这表明术语表文件可能未被成功加载或应用。请按以下步骤排查:1. 确认术语表文件已正确关联:在视频翻译主界面,点击“翻译术语表”右侧的文件夹图标,重新选择您的术语表.txt文件。2. 验证文件内容与编码:用记事本打开术语表文件,确保内容为 源词=目标词 格式,并且文件编码...
    103.172* Posted at: 16 hours ago
  • #4140 RuntimeError: {'message': 'prompt_lang is required'}...
    💬 1
    [Last reply:16 hours ago] 这个错误是由于在使用 OmniVoice-TTS 配音时,缺少了必需的 prompt_lang 参数导致的。解决方案:重新下载最新版本:此问题已在 v3.99 版本中修复。请前往官网下载最新的完整软件包。覆盖安装:将下载的最新版 sp.exe 文件覆盖到您当前的软件目录 C:/tool/fanyi/win-pyvide...
    2602:f87f* Posted at: 16 hours ago
  • #4138 语音识别的整个流程是怎样的...
    💬 3
    [Last reply:17 hours ago] LLM重新断句是语音识别后处理环节中的一个可选步骤,用于优化字幕的断句效果。所处环节: 在语音识别模型(如faster-whisper)完成音频转文本并生成初步字幕时间轴后,但在最终生成SRT字幕文件之前。具体流程:初步识别:语音识别模型输出原始的文本片段及其对应的时间戳。LLM重新断句:如果启用了此功能,软件会将一批...
    103.172* Posted at: 17 hours ago
  • #4137 AI翻译模型温度值怎么用,原理是什么...
    💬 1
    [Last reply:17 hours ago] AI翻译模型温度值用于控制翻译结果的随机性和创造性。其原理是:温度值越高(如1.0),模型输出的随机性越大,翻译结果可能更具创造性但可能偏离原文;温度值越低(如0.2),模型输出越确定和保守,翻译结果更稳定、更贴合常规表达。在pyVideoTrans中,你可以在 菜单 -> 工具/选项 -> 高级选项 -&...
    103.172* Posted at: 17 hours ago
  • #4136 videotrans.configure._except.StopRetry: Internal error encountered....
    💬 1
    [Last reply:18 hours ago] 这是由于 Gemini 语音识别 API 服务端返回了内部错误(500 INTERNAL)导致的。降低请求频率:在 菜单 -> 工具/选项 -> 高级选项 中,找到 Gemini语音识别每批切片数,将其数值调小(例如从默认值调为 1 或 2),以减少单次发送的数据量。检查网络连接:确保你的网络可以稳定访问 ...
    2a09:bac5* Posted at: 18 hours ago
  • #4135 TaskCfgSTT(is_cuda=True, uuid='5b5ab85bf3', cache_folder='C:/pyvideotrans/tmp/13216/5b5ab85bf3', target_dir='C:/SOFT/pyv...
    💬 1
    [Last reply:18 hours ago] 这是由于 Gradio Client 无法连接到您部署在 Google Colab 的 VibeVoice-ASR 服务的公共 URL 导致的。解决方案:确认服务状态:首先,请确保您的 Google Colab 笔记本中 VibeVoice-ASR 的 Gradio 服务正在运行,并且已成功生成了一个 public U...
    103.62* Posted at: 18 hours ago
  • #4134 root@RainYun-8HTeGSfr:~/VocalSeparate/pyvideotrans# uv run sp.pyTraceback (most recent call last): File "/root/VocalSep...
    💬 5
    [Last reply:18 hours ago] 这是由于您下载的源码版本不包含 webui.py 文件。该文件可能仅在特定版本或分支中提供。核心原因:您当前的 pyVideoTrans 源码目录中没有 webui.py 文件。解决方案:确认版本:请检查您下载的版本是否为最新版 v3.99,并确认该版本是否包含 WebUI 功能。您可以访问项目主页或文档查看。下载完整...
    154.9* Posted at: 18 hours ago
  • #4132 语音识别的提示词在哪个文件中设置...
    💬 13
    [Last reply:19 hours ago] 配音语速参数在 v3.99 版本中已得到修正,现在可以正常生效。该参数用于整体调整配音的语速,以应对不同语言间表达时长差异带来的音画同步问题。使用方法与原理:参数位置:在主界面“配音角色”下拉菜单右侧,有“配音语速”输入框。参数含义:输入百分比数值。正值表示加速,负值表示减速。例如:输入 10 表示语速加快 10%,输...
    103.172* Posted at: 21 hours ago
  • #4133 TaskCfgVTT(is_cuda=True, uuid='8559824178', cache_folder='E:/usr/Application/AI-Models/apps/pyvideotrans/tmp/22488/85598...
    💬 1
    [Last reply:19 hours ago] 这是由于显存不足或GPU进程池崩溃导致的。错误信息显示在使用 faster-whisper(本地) 的 large-v3 模型进行语音识别时,GPU进程池意外终止,提示可能内存或显存不足。解决方案:使用更小的模型:在语音识别渠道的下拉菜单中,将模型从 large-v3 更换为 medium、small 或 base。l...
    183.208* Posted at: 19 hours ago
  • #4131 src目录下的deepseek.txt该怎样使用...
    💬 1
    [Last reply:22 hours ago] src目录下的deepseek.txt文件是用于配置DeepSeek AI翻译渠道的提示词文件。该文件允许你自定义AI翻译时的指令,以优化翻译效果。使用方法:找到文件:在软件安装目录下的 src/prompts/ 文件夹中,找到 deepseek.txt 文件。编辑内容:使用文本编辑器打开此文件,修改其中的提示词。你可...
    103.172* Posted at: 22 hours ago
Open source and free maintenance is not easy. If this project is helpful to you, please consider making a small donation to help the project continue to maintain and update.

Related resource