#4112 软件能否自动识别说话人?

95.85* Posted at: 1 hour ago 👁8

软件能否自动识别说话人?并将多个说话人的说话片段进行切割,无需配音。

1 Replies

可以。pyVideoTrans 支持说话人分离功能,可以自动识别并区分视频中不同说话人的语音片段,并将字幕按说话人进行切割和标记。

操作步骤:

  1. 在软件主界面,点击“设置更多参数...”。
  2. 勾选“识别说话人”选项。
  3. 在“识别说话人”选项后的输入框中,可以填写您预估的说话人数量(例如 2),这有助于提高识别准确度。如果不确定,可以留空或填 0
  4. 在“菜单” -> “工具/选项” -> “高级选项” -> “语音识别参数”中,可以切换不同的说话人分离模型(如内置模型、阿里 CAM++、Pyannote 3.1 等)。
  5. 在“配音渠道”中选择“不配音”。
  6. 正常选择语音识别渠道(如 faster-whisper)并开始任务。

处理完成后,生成的 SRT 字幕文件会为不同说话人的语句打上标签(如 [说话人0][说话人1]),从而实现自动切割和区分。

请查阅相关文档:

Post Your Reply
Open source and free maintenance is not easy. If this project is helpful to you, please consider making a small donation to help the project continue to maintain and update.

Related resource