#4088 在使用Index-TTS配音角色选择clone时 进度条中显示的分段199段 但是进度被停止在了clone200.wav无法找到 tmp目录里面有 clone199 clone201 但是没有clone200

168.70* Posted at: 2 days ago 👁21

image

1 Replies

这是由于 Index-TTS 服务在处理特定语音片段(第200段)时失败,导致无法生成对应的 clone200.wav 文件,从而任务卡住。

解决方案:

  1. 检查 Index-TTS 服务状态:确保 Index-TTS 的 API 服务正在运行且未报错。查看其运行终端窗口,确认在处理第200段音频时是否有错误信息。
  2. 检查参考音频:确认 软件目录/f5-tts 文件夹内已放置了有效的参考音频文件(3-10秒的清晰人声片段)。
  3. 调整语音识别参数:在软件中,进入 菜单 -> 工具/选项 -> 高级选项,在“语音识别参数”区域进行以下设置,以确保生成的语音片段长度适合克隆:

    • 最短语音持续毫秒 设置为 3000
    • 最长语音持续秒数 设置为 10
    • 勾选 Whisper预分割音频?合并过短字幕到相邻
  4. 清理缓存并重试:在主界面左上角勾选 清理已生成,然后重新处理视频。这将强制重新生成所有中间文件。
  5. 手动处理缺失片段:如果问题依旧,可以尝试在 tmp 目录中找到对应的字幕文件(如 subtitle_200.srt),查看其内容。然后可以尝试使用 Index-TTS 的 WebUI 界面,手动用该段文本和参考音频生成 clone200.wav,并将其放入 tmp 目录中,再尝试继续任务(此方法较复杂)。

根本原因分析:
Index-TTS(以及 F5-TTS、CosyVoice 等)在进行声音克隆时,对输入的参考音频片段(即原视频中对应时间段的语音)有严格要求(通常需3-10秒)。如果第200段字幕对应的原始语音时长不在此范围内,或质量不佳(如静音、噪音过大),克隆就会失败。

请查阅相关文档:

Post Your Reply
Open source and free maintenance is not easy. If this project is helpful to you, please consider making a small donation to help the project continue to maintain and update.

Related resource