建议1:在视频提取音频、音频识别为字幕、字幕翻译、字幕配音和视频合成各阶段中键暂停一下(增加一个勾选框,是否自动进行下一步,如果勾选则全流程自动逐步执行,不勾选则完成一步询问进行下一步),以便于修改完善每一步的成果。
建议2:将音频识别为字幕、字幕翻译等子功能模块也像视频识别为字幕一样内嵌到tab选项卡里(不是单独窗口)。
建议3:音视频转字幕时(STT),建议增加波形图,便于添加断句标记,减少提取字幕时的错误。增加音视频预处理,减少杂音造成的提取错误(uvr5)。
建议4:字幕配音时(TTS),增加字幕转语音,控制时间对齐到时间节点。
建议5:标准模式与分阶段模式的输入和输出路径统一,方便调用。