• #4159 [mov,mp4,m4a,3gp,3g2,mj2 @ 00000267be3504c0] moov atom not found F:/softwares/win-pyvideotrans-v3.96-22/tmp/4896/ab26504...
    💬 1
    [Last reply:3 days ago] 这是由于视频处理过程中生成的无声视频文件损坏导致的,具体表现为 moov atom not found 错误。解决方案:清理缓存并重试:在软件主界面左上角勾选 清理已生成 复选框,然后重新处理视频。这将强制软件重新生成所有中间文件。检查文件路径:确保输入视频的文件路径和名称简短且不含中文或特殊符号。建议将视频移动到浅层...
    77.93* Posted at: 3 days ago
  • #4158 pyvideotrans目录中包含有哪些提示词文件,这些提示词文件分别又对应的是哪些功能,如果我的需求是把v3.98的这些配置覆盖到3.99版本,我要覆盖哪些文件才行...
    💬 5
    [Last reply:3 days ago] recharge-llm.txt 文件的主要内容是指导 AI 大模型(如 GPT、DeepSeek 等)如何对语音识别生成的字幕进行重新断句和优化的系统指令。其核心目的是:将识别出的、可能过长或过短、断句不自然的字幕,根据语义和语法规则,重新分割成更符合阅读习惯、长度更适宜的句子。该提示词文件通常会包含以下关键指令:任...
    2409:8a55* Posted at: 3 days ago
  • #4157 二次语音识别在什么情况下不会生效...
    💬 1
    [Last reply:3 days ago] 二次语音识别(二次识别)在以下情况下不会生效:未选择配音:二次识别仅在“视频翻译”或“批量为字幕配音”功能中,选择了配音渠道并生成了配音音频后才会执行。如果只进行语音识别和翻译,不进行配音,则二次识别不会触发。未嵌入单字幕:在主界面中,如果字幕嵌入方式选择了“不嵌入字幕”、“嵌入硬字幕(双)”或“嵌入软字幕(双)”,二...
    2409:8a55* Posted at: 3 days ago
  • #4156 语音识别环节断句问题...
    💬 5
    [Last reply:3 days ago] 这是“合并过短字幕”功能与原始音频语义切分之间的权衡结果。当您启用“合并过短字幕到邻近”后,软件会强制将过短的句子与相邻句子合并,以消除过短片段。合并的逻辑是基于时间相邻性,而非语义完整性,因此可能将原本语义独立但时间上接近的两句话合并成一句,从而导致合并后的字幕行时长变长(例如7-8秒)。要解决此问题,您需要调整“最...
    2409:8a55* Posted at: 3 days ago
  • #4155 就是半句话,末尾没标点,另一半在下一条字幕的开始位置,这种怎么样避免,至少在切分字幕的时候,能保证一个短句得说完,以出现标点为准...
    💬 1
    [Last reply:3 days ago] 这是由于语音识别模型在分割音频片段时,没有以完整的句子或标点符号为边界导致的。要确保字幕以完整句子为单位,避免半截句,需要进行以下配置调整。解决方案:调整语音识别参数:打开软件,点击顶部菜单栏的 工具/选项 -> 高级选项。找到 【语音识别参数】 区域。将 静音分割持续毫秒 的值增大,例如从默认的 500 调整为...
    2409:8a55* Posted at: 3 days ago
  • #1642 在翻译 srt 字幕时,添加了术语表,为什么没有按照术语表的设置翻译?...
    💬 11
    [Last reply:3 days ago] AI翻译的温度参数(temperature)设置不起作用,通常是因为您使用的翻译渠道不支持此参数。原因与解决方案:确认翻译渠道:温度参数是大型语言模型(LLM)特有的高级参数,仅对 OpenAI ChatGPT、DeepSeek、Gemini、Claude 等 AI 渠道有效。如果您使用的是 Google、微软、百度等...
    38.150* Posted at: 4 months ago
  • #4153 英语语音识别,推荐用哪个渠道...
    💬 1
    [Last reply:3 days ago] 英语语音识别推荐使用 faster-whisper(本地) 渠道,并选择 large-v3 模型。这是兼顾速度与准确度的最佳免费本地方案。具体配置步骤如下:在主界面“语音识别”下拉菜单中,选择 faster-whisper(本地)。在右侧模型选择中,选择 large-v3 模型(效果最好)。如果您的硬件资源有限,可降级...
    2409:8a55* Posted at: 3 days ago
  • #4152 tenvad和silero有什么区别...
    💬 5
    [Last reply:3 days ago] “文本规范化”是指在配音前,对字幕文本进行预处理,使其更符合语音合成的发音规则,从而提高配音的自然度和准确性。核心作用:处理数字、符号、缩写等:例如,将“2024年”转换为“二零二四年”,将“100kg”转换为“一百千克”,将“Dr.”根据上下文转换为“Doctor”或“Drive”。统一格式:确保文本格式一致,避免因...
    2409:8a55* Posted at: 3 days ago
  • #4151 LLM重新断句该怎样设置...
    💬 1
    [Last reply:3 days ago] LLM重新断句功能用于优化语音识别后生成的字幕断句效果,使其更符合阅读习惯。设置步骤如下:在软件主界面,点击顶部菜单栏的 工具/选项 -> 高级选项。在弹出的高级选项窗口中,找到 【通用设置】 区域。设置相关参数:LLM重新断句每批字幕行数:设置每次发送给AI模型处理的字幕条数。数值越大,断句效果越好(上下文更完...
    120.231* Posted at: 3 days ago
  • #4146 能兼容调用UVR5 - MDX23C-InstVoc HQ模型吗?...
    💬 4
    [Last reply:3 days ago] 核心原因是软件内置的人声分离模型(UVR)效果可能不如你期望的 UVR5 - MDX23C-InstVoc HQ 模型。根据开发者回复,软件主界面“设置更多参数”中勾选的“分离人声背景声”,默认使用的就是 UVR 模型。如果你已启用此选项但效果仍不理想,说明当前内置的模型分离能力不足以完全滤除你视频中的背景音乐干扰。解...
    142.202* Posted at: 4 days ago
  • #4150 Permission denied: C:/Users/Solofo/Documents/test/YouTube Killed Shorts - WAN Show April 17, 2026.mp3...
    💬 1
    [Last reply:3 days ago] This error occurs because the file path contains special characters (like ?) or is too long, which is not compatible with Windows command-line operations (used ...
    78.120* Posted at: 3 days ago
  • #4149 什么是传统翻译每次字幕行数,和AI翻译有什么区别...
    💬 3
    [Last reply:4 days ago] 单词或短语被拆分为两条字幕并出现连字符,通常是语音识别(ASR)模型在处理音频时,根据静音或语音活动检测(VAD)参数进行强制分割的结果。核心原因:语音识别模型(如Whisper)将连续的音频流切割成片段进行识别。当某个单词或短语的发音恰好跨越了两个音频片段的切割点时,模型可能会将其识别为两部分,并在中间插入连字符“-...
    2409:8a55* Posted at: 4 days ago
  • #4148 短视频相比长视频,翻译最终结果的质量和准确率是不是要差很多,特别是同一段话,在长视频中跟随全部内容翻译下来,问题会很少,但如果单独截出来,成为一短短视频,再翻译就会错误连篇,各种不通顺,为什么...
    💬 7
    [Last reply:4 days ago] 是否开启“启用上下文感知”取决于你的硬件条件和需求,它是一把双刃剑。开启(推荐有条件时开启):优点:能显著提升语音识别(特别是Whisper系列模型)的准确性和连贯性,因为模型会参考前后的音频内容来理解当前片段。缺点:会占用更多GPU显存,处理速度可能略有下降,并且在某些情况下(如音频质量差、背景音复杂)可能增加“幻觉...
    2409:8a55* Posted at: 4 days ago
  • #4147 老外总是大喘气,所以经常断句成半句话...
    💬 1
    [Last reply:4 days ago] 这是由于语音识别模型在分割语音片段时过于敏感,将自然停顿或换气识别为句子边界导致的。解决方案:调整语音识别参数:点击顶部菜单栏的 工具/选项 -> 高级选项,在“语音识别参数”区域进行如下修改:静音分割持续毫秒:将此值从默认的 500 增大,例如设为 800 或 1000。这会让软件在更长的静音后才进行分割,从而...
    2409:8a55* Posted at: 4 days ago
  • #4145 RuntimeError: 40e14458f5 split no voice error:opening input: No such file or directory opening input file -hwaccel. open...
    💬 1
    [Last reply:4 days ago] 这是由于视频文件路径过长或包含特殊字符,导致 ffmpeg 命令执行失败。重命名并移动视频文件:将待处理的视频文件重命名为一个简短的英文或数字名称(例如 video.mp4),并将其移动到较浅的目录下(例如 D:\videos)。检查软件路径:确保 pyVideoTrans 软件本身也安装在路径简短且不含中文或特殊符号...
    103.172* Posted at: 4 days ago
  • #4144 TaskCfgSTT(is_cuda=True, uuid='0f4c8160a8', cache_folder='D:/xiazai/win-pyvideotrans-v3.98-0410/tmp/16640/0f4c8160a8', t...
    💬 1
    [Last reply:4 days ago] 这是由于显存或内存不足导致语音识别进程崩溃。错误信息明确指出“可能内存或显存不足 Model:large-v3-turbo GPU0”。虽然之前使用正常,但处理不同视频时(如更长、更复杂的音频)或系统后台有其他程序占用资源,都可能突然触发此问题。解决方案:降低模型规格:在语音识别渠道的下拉菜单中,将模型从 large-...
    240e:38c* Posted at: 4 days ago
  • #4143 HTTPSConnectionPool(host='edge.microsoft.com', port=443): Max retries exceeded with url: /translate/auth (Caused by Prox...
    💬 1
    [Last reply:4 days ago] 这是由于网络代理配置错误或代理服务未启动导致的。软件尝试通过代理连接微软翻译服务,但代理服务器无法连接。解决方案:检查代理服务状态:确保你的 VPN 或代理客户端正在运行。核对代理地址:在软件主界面的“网络代理地址”文本框中,确认你填写的地址和端口是否正确。格式应为 http://127.0.0.1:端口号(例如 ht...
    183.192* Posted at: 4 days ago
  • #4142 requests.exceptions.ProxyError: HTTPSConnectionPool(host='dev.microsofttranslator.com', port=443): Max retries exceeded ...
    💬 1
    [Last reply:4 days ago] 这是由于网络代理设置错误或代理服务未启动导致的。软件尝试通过您设置的代理连接微软翻译服务,但代理服务器拒绝了连接。解决方案:检查您的代理客户端(如VPN、Clash等)是否已成功启动并正常运行。确认您在软件“网络代理地址”文本框中填写的地址和端口号是否正确。格式通常为 http://127.0.0.1:端口号。如果您没...
    123.88* Posted at: 4 days ago
  • #4141 识别说话人后并没有标记角色...
    💬 5
    [Last reply:4 days ago] 根据日志,问题已明确:说话人分离模型(阿里cam++)已成功运行并返回了结果(识别出多个说话人ID:0, 1, 2, 3, 4),但后续处理中,这些说话人标记未能成功关联并写入到最终的字幕文件。日志显示“识别出个 0 说话人”是格式错误,实际已识别出多个ID。核心原因是:在“翻译视频或音频”的流程中,说话人分离产生的时...
    182.107* Posted at: 4 days ago
  • #4139 二次语音识别,识别出的字幕的字数有什么需要注意的吗...
    💬 9
    [Last reply:4 days ago] 日志中没有“术语表”或“glossary”关键词,这表明术语表文件可能未被成功加载或应用。请按以下步骤排查:1. 确认术语表文件已正确关联:在视频翻译主界面,点击“翻译术语表”右侧的文件夹图标,重新选择您的术语表.txt文件。2. 验证文件内容与编码:用记事本打开术语表文件,确保内容为 源词=目标词 格式,并且文件编码...
    103.172* Posted at: 4 days ago
Open source and free maintenance is not easy. If this project is helpful to you, please consider making a small donation to help the project continue to maintain and update.

Related resource