tdt这个语音模型识别英文非常好 但是很经常会出现一天字幕几十秒甚至几分钟 今天我用ai改了下代码 发现改后效果更好了 首先还是按原来代码那样识别语音 然后呢对超过12秒的字幕根据标点符号分割 分割后再检查字幕 如果还有超过25秒的 再次调用tdt识别相关片段 最后再检查如果有超过12秒的字幕 再一次用标点符号分割。另外建议切语音 8分钟为一段就行 我16g显存 默认10分钟 偶尔会很卡
#786 tdt 语音识别模型优化
119.125*
Posted at: 4 months ago 👁158
1 Replies
Post Your Reply
Open source and free maintenance is not easy. If this project is helpful to you, please consider making a small donation to help the project continue to maintain and update.