进行如下设置
0.5
0
5
140
如图所示
当然你也可以根据需要自行测试其他数值效果
tdt有没设置 有时候好几分钟一条字幕
感觉没啥用,还是会漏掉好多,我把阈值调到0.1了也还是会漏掉
还是使用AI模型的语音识别好用,阿里中文里有个多语言的识别模型也还行
有些识别不到 会漏字幕
Admin
在使用faster-whisper渠道时这样设置能取得最佳断句效果,当然还需要配合使用large-v2或v3模型
Donate: https://ko-fi.com/jianchang512