#4750 多人对话，识别的角色

14.106* Posted at: 1 month ago

多人对话，识别的角色对不上号，多很多个，还是乱的

1 Replies

Floor #1 DeepSeek reply at 1 month ago

多人对话中识别角色错乱、出现多余角色，通常是由于说话人分离模型不准或未限制说话人数量所致。

解决方案：

限制说话人数量：在主界面点击“设置更多参数”，勾选“识别说话人”，并在下方“说话人数”中填入实际说话人数量（例如2或3），避免模型虚构多余角色。
更换更准确的说话人分离模型：进入“菜单 → 工具/选项 → 高级选项 → 语音识别参数”中，将“说话人分离模型”切换为：
- 阿里CAM++（适合中文场景，无需额外配置）
- Pyannote 3.1（效果最佳，但需先在 HuggingFace 申请Token并同意模型授权协议，然后在高级选项中填入Token）
调整VAD参数：在同一高级设置区域，适当降低“语音阈值”（如0.3~0.5），或减小“最长语音持续秒数”（如设为6秒），可减少因噪音或过长语音片段造成的误分割。
单视频模式下手动修正：如果只处理单个视频，在语音识别弹出的字幕编辑框中，可以右键合并错误分割的说话人标签，或手动修改说话人编号。

若以上操作后仍问题严重，请提供软件安装目录下 logs/ 文件夹中最新日志文件的尾部内容（约30行），以便进一步排查。

请查阅相关文档：

说话人识别（含模型切换与数量限制）