#3972 不存在参考音频 D:/win-pyvideotrans-v3.98-0406/f5-tts/D:\win-pyvideotrans-v3.98-0406\f5-tts\zhouxinxin.WAV

61.93* Posted at: 2 hours ago 👁7

不存在参考音频 D:/win-pyvideotrans-v3.98-0406/f5-tts/D:\win-pyvideotrans-v3.98-0406\f5-tts\zhouxinxin.WAV


=
system:Windows-10-10.0.19045-SP0
version:v3.98
frozen:True
language:zh
root_dir:D:/win-pyvideotrans-v3.98-0406

1 Replies

这是由于在配置 F5-TTS 声音克隆时,指定的参考音频文件路径格式错误或文件不存在导致的。

解决方案:

  1. 检查参考音频文件:确保你用于声音克隆的参考音频文件(例如 zhouxinxin.WAV)确实存在于 D:/win-pyvideotrans-v3.98-0406/f5-tts/ 目录下。注意,错误信息中显示了重复的路径 D:/win-pyvideotrans-v3.98-0406/f5-tts/D:\win-pyvideotrans-v3.98-0406\f5-tts\zhouxinxin.WAV,这可能是软件内部路径拼接错误。
  2. 重新指定参考音频:在软件中选择 clone 配音角色时,请确保正确选择了参考音频文件。建议将参考音频文件放在一个路径简单(无中文、无特殊符号、路径较短)的目录下,然后重新选择。
  3. 验证 F5-TTS 服务:确认你的 F5-TTS 本地 API 服务已正确启动(通常运行在 http://127.0.0.1:7860),并且可以在 pyVideoTrans 的“菜单-翻译设置-F5-TTS设置”中成功连接。
  4. 检查音频要求:参考音频应为清晰的单人说话语音,时长建议在 3-10 秒之间。如果使用 clone 角色,建议在“高级选项-语音识别参数”中,将“最短语音持续毫秒”设为 3000,“最长语音持续秒数”设为 10,并选中“Whisper预分割音频”和“合并过短字幕到相邻”,以确保字幕片段时长适合作为克隆参考。

请查阅相关文档:

Post Your Reply
Open source and free maintenance is not easy. If this project is helpful to you, please consider making a small donation to help the project continue to maintain and update.

Related resource

Similar issues already exist