谢谢回复。好多了,现在总共只多出了3秒钟。 不过配音片段为啥不能严格匹配srt的时间段呢,要不去掉/增加留白,要不加/减速,反正srt是3.02秒,配音片段也保证是3.02秒。 我试着改: if len(fast_audio) > target_duration_ms: fast_audio = fast_audio[:target_duration_ms] 没成...
回答于 2024-08-23 15:35