#995 识别字幕不对,怎么修改字幕呢,原来的字幕有53句的,现在只有13句

202.232* Posted at: 7 days ago 👁21

image
识别字幕不对,怎么修改字幕呢,原来的字幕有53句的,现在只有13句

1 Replies

本条内容由 gpt-5-mini 回复

很可能是“识别(ASR)分段/句子合并”或“翻译步骤合并字幕”导致的。请按下面步骤定位并修复:

  1. 判定问题位置(关键一步)

    1. 在主界面只运行「音视频转字幕(仅识别)」,不要做翻译或配音。
    2. 打开生成的源语言 .srt 文件(软件输出目录或运行目录下的结果文件),查看实际行数:

      • 如果源语言 .srt 只有 13 行,问题出在语音识别(ASR)阶段。
      • 如果源语言 .srt 有 53 行,但翻译后/最终结果只有 13 行,问题出在翻译/合并阶段。
  2. 如果是语音识别(ASR)导致(源 .srt 只有 13 行)

    1. 检查「菜单 -> 语音识别设置」里选择的识别渠道(faster-whisper / openai-whisper / 阿里FunASR 等),尝试切换到其它渠道再识别一次,或换用性能更强的模型。
    2. 如果使用本地模型,确认本地模型已完整下载(首次使用需下载);若下载失败,按 FAQ 里建议设置代理或手动下载模型文件。
    3. 进入「菜单 -> 工具 -> 高级选项」,查找与“识别分段/句子合并(silence/threshold/segment)”相关的设置并调整(例如降低合并阈值或缩短最小句长),然后重新识别。
    4. 临时方案:如果急需,可用文本编辑器手动拆分/编辑生成的 .srt(SRT 是纯文本格式),或把源视频输出为 WAV 后用其他识别渠道测试。
  3. 如果是翻译/合并阶段导致(源 .srt 有 53 行但翻译结果变为 13 行)

    1. 打开「菜单 -> 翻译设置」,将“同时翻译的字幕数”设为 1,并取消“发送完整字幕”(这是 FAQ 推荐的修复方法),然后重新翻译。
    2. 若使用本地小模型做翻译,可能导致缺失或被合并,建议改用在线能力更强的翻译渠道(如 Gemini/DeepSeek/DeepL 等)。
  4. 仍未解决时请提供信息以便进一步分析

    • videotrans/logs/ 目录下最近的日志文件(按日期的 .log)。
    • 源语言的 .srt(只识别阶段生成的文件)和翻译后输出的 .srt 两个文件。
    • 当前在「语音识别设置」「翻译设置」「工具->高级选项」中使用的具体渠道与关键配置(截图或文字均可)。
  5. 临时提示

    • 可先手动用文本编辑器修正 .srt(若只是少量句子错分),然后使用“批量为字幕配音/合并”功能继续后续步骤。
    • 若本地模型下载或渠道报错,请一并把日志贴上,便于判断是否为模型/网络问题。

如果按以上诊断仍不能定位原因,请把最新日志文件和相关 .srt 发来(位于 videotrans/logs/ 和输出目录),我根据日志给出具体修复步骤。

Post Your Reply
Open source and free maintenance is not easy. If this project is helpful to you, please consider making a small donation to help the project continue to maintain and update.

Donate: https://ko-fi.com/jianchang512

Trending Questions