#5026 100:00:00,064 --> 00:00:06,783女人无意中撞破了婆婆的秘密,所谓的痴呆全是装出来的,而电话那头的丈夫不仅在京市安了家,甚至连二胎都生了。200:00:06,783 --> 00:00:09,714八年

104.160* Posted at: 8 hours ago

1
00:00:00,064 --> 00:00:06,783
女人无意中撞破了婆婆的秘密,所谓的痴呆全是装出来的,而电话那头的丈夫不仅在京市安了家,甚至连二胎都生了。

2
00:00:06,783 --> 00:00:09,714
八年的全心付出,在这一刻成了彻头彻尾的笑话。

3
00:00:09,714 --> 00:00:17,487
她终于明白丈夫长年不肯要孩子,实则是为了给外面的女人留位置,女人没有歇斯底里,而是果断联系了那个暗恋自己十年的男人,询问对方是否还愿娶自己。

4
00:00:17,487 --> 00:00:22,487
电话那头的男人听闻后激动不已,恨不得立刻就能飞奔过来。为什么识别的字幕,时间轴内那么长的字幕呢

7 Replies

语音识别生成的字幕时间轴内包含长句,原因是语音识别阶段的分割参数设置过大。软件默认的“最长语音持续秒数”为6秒,“静音分割持续毫秒”为500ms,当音频中连续语音较长或静音间隔较短时,会合并为一条长字幕。

解决方案

  1. 缩短最长语音时长
    点击主界面上的设置更多参数,找到最长语音持续秒数,将其改为 3 或 4 秒(数值越小,字幕切分越碎)。
    注意:若使用“clone”配音角色,建议设为 5-6 秒以保证参考音频长度足够。
  2. 减小静音分割阈值
    在同一界面将静音分割持续毫秒从默认 500 降低至 200~300ms(更小的静音间隙即可触发分割)。
    数值过低可能导致噪音被误判为语音,请根据实际音频环境微调。
  3. 启用 VAD 预分割
    菜单 → 工具 → 高级选项 → 语音识别参数中,确保Whisper预分割音频? 已勾选(可更灵活地按语义停顿分割)。
  4. 使用 LLM 重新断句
    若已配置 DeepSeek 或 OpenAI 翻译渠道,可在翻译渠道右侧选择LLM重新断句模式,AI 会自动将长句拆分为自然短句并修正时间轴。

参考文档

按以上步骤调整后,重新处理视频即可获得更短、更自然的字幕时间轴。

缩短最长语音时长
点击主界面上的设置更多参数,找到最长语音持续秒数,将其改为 3 或 4 秒(数值越小,字幕切分越碎)。
注意:若使用“clone”配音角色,建议设为 5-6 秒以保证参考音频长度足够。 没有看到这个

抱歉,上一条描述不够准确。“最长语音持续秒数”并不在主界面“设置更多参数”弹窗中,而是在菜单栏 → 工具/选项 → 高级选项内。

请按以下步骤操作:

  1. 点击软件顶部菜单栏的 工具选项
  2. 在弹出的窗口中切换到 高级选项 标签页。
  3. 找到 语音识别参数 区域,即可看到 最长语音持续秒数 滑块或输入框。
  4. 将其值改为 3 或 4(若需使用“clone”配音,建议设为 5~6),然后保存。

同一区域还可调整 静音分割持续毫秒(默认 500,可降至 200~300)和启用 Whisper预分割音频? 勾选框,进一步控制断句粒度。

调整后重新处理视频即可得到更短的字幕时间轴。

选择LLM重新断句,必须先在菜单-翻译设置--OpenAIAPI中设置可用模型和
密钥信息,可在高级选项中切换使用DeepSeek断句 这个在哪里下载,有教程吗

LLM 重新断句所需的 API 密钥并非“下载”,而是需要您在对应 AI 平台的官网注册账号后获取 API Key。具体配置步骤如下:在主界面点击菜单栏 翻译设置,选择 DeepSeek 或 OpenAI 对应的设置面板。填写你的 API Key 和模型名称(例如 deepseek-chatgpt-4o)。保存后,前往 菜单 → 工具 → 高级选项 → 通用设置,将“LLM 重新断句所用 AI 渠道”切换为 DeepSeek 或 OpenAI。详细教程请参考以下文档:- DeepSeek 翻译渠道配置- OpenAI 翻译渠道配置若您尚未注册这些平台,可自行搜索“DeepSeek API注册”或“OpenAI API获取”,按照官方指引获取 Key 后按上述步骤填写即可。

DeepSeek 翻译渠道配置-要收费的吗

DeepSeek API 是收费的,费用极低(输入约 0.0005 元/千 tokens,输出约 0.002 元/千 tokens,翻译一条长视频通常消耗几分钱到几毛钱)。

如果您希望完全免费使用 LLM 断句,可改用 微软翻译(无需代理)或 Google 翻译(国内需配置代理)作为翻译渠道。但请注意:传统翻译渠道不支持 LLM 重新断句(仅 AI 渠道如 DeepSeek/OpenAI 支持)。

替代方案(免费且无需 API 密钥):

  1. 在高级选项中关闭 LLM 重新断句。
  2. 通过调整 VAD 参数(如将“最长语音持续秒数”设为 3,静音分割毫秒设为 200)从源头优化断句,无需额外成本。
  3. 若仍希望使用 AI 断句,可考虑注册 硅基流动302.AI 等平台,它们通常提供免费额度,配置方法类似 DeepSeek。

DeepSeek API 密钥可通过 platform.deepseek.com 注册获取(需实名认证)。

Post Your Reply
Open source and free maintenance is not easy. If this project is helpful to you, please consider making a small donation to help the project continue to maintain and update. Dondate: ko-fi.com/jianchang512

Related resource