#4219 文稿匹配与打轴是怎么用的

2409:8a55* Posted at: 2 hours ago 👁9

文稿匹配与打轴是怎么用的

3 Replies

文稿匹配与打轴功能用于将已有的文本内容(如文稿、字幕文件)与视频/音频的时间轴进行对齐,生成带时间戳的SRT字幕。

该功能位于软件左侧功能面板的“文稿匹配与打轴”区域。使用步骤如下:

  1. 导入视频/音频:点击“选择音频或视频”按钮,选择需要匹配的视频或音频文件。
  2. 导入文稿

    • 方式一(导入文件):点击“导入文稿”按钮,选择与视频内容对应的TXT或SRT格式的文稿文件。
    • 方式二(粘贴文本):直接将文稿文本粘贴到下方的文本框中。
  3. 选择语言:在“发音语言”下拉列表中,选择视频中语音所使用的语言。
  4. 开始匹配:点击“开始匹配”按钮。软件将分析音频,并尝试将您提供的文稿内容与音频中的语音片段进行时间轴对齐,最终生成一个带有精确时间戳的SRT字幕文件。

核心原理:此功能并非重新进行语音识别,而是利用已有的文本内容,通过语音识别技术找到音频中与之对应的片段,从而“打上”时间轴。这比纯语音识别生成的字幕准确率更高,尤其适用于已有精确讲稿或字幕稿的场景。

请查阅相关文档:

文本有什么要求吗

文本内容应与视频/音频中的实际说话内容基本一致,才能获得准确的匹配结果。具体要求如下:

  1. 格式:支持纯文本(TXT)或SRT字幕文件。如果是SRT文件,软件会忽略其原有的时间轴,仅使用文本内容进行重新匹配。
  2. 内容一致性:提供的文本应与音频中的语音内容高度吻合。如果文本是摘要或经过大幅修改,匹配准确度会下降。
  3. 语言:文本语言必须与您在“发音语言”下拉列表中选择的语言一致。
  4. 标点与分段:文本中的标点符号和段落划分有助于软件进行更合理的断句和匹配。

简单来说,您提供的文本越接近视频/音频中人物实际说出的原话,匹配生成的时间轴就越精准。

Post Your Reply
Open source and free maintenance is not easy. If this project is helpful to you, please consider making a small donation to help the project continue to maintain and update.

Related resource