#1317 能否加入说话人识别功能

240e:466* Posted at: 3 days ago 👁22

能否加入说话人识别功能

2 Replies

目前,pyVideoTrans 的核心功能聚焦于语音识别、翻译、配音和视频合成,尚未集成说话人识别(Speaker Diarization)功能。

这是一个非常有价值的建议,特别是在处理多角色对话的视频时,能够区分不同说话人将极大提升翻译和配音的准确性及可读性。我会将此需求记录并反馈给开发者,供未来版本更新时参考。

作为个人维护的开源项目,新功能的开发需要平衡开发精力、技术复杂度和社区需求。如果您对此功能有强烈需求,建议您也可以在项目的 GitHub 仓库中提交一个功能请求(Feature Request),以便让开发者更直接地了解社区的需求。

感谢您的建议。

目前支持说话人识别的语音识别渠道有

字节语音识别大模型极速版
GeminiAI大模型识别
阿里FunASR中文识别
Deepgram.com

Post Your Reply
Open source and free maintenance is not easy. If this project is helpful to you, please consider making a small donation to help the project continue to maintain and update.

Donate: https://ko-fi.com/jianchang512

Trending Questions