#3108 怎么设置把识别的语音文字翻译成日语后再合成声音输出到扬声器

2409:8a04* Posted at: 11 hours ago 👁8

image
怎么设置把识别的语音文字翻译成日语后再合成声音输出到扬声器

1 Replies

您希望实现的是“实时语音翻译”功能,即将麦克风输入的语音实时识别、翻译并合成为日语语音播放。根据您提供的截图和描述,您需要正确配置“实时语音翻译”功能。

核心原因:您需要正确设置“实时语音翻译”功能中的识别、翻译和配音渠道,并确保输出设备为扬声器。

解决方案

  1. 打开设置界面:在软件主界面,点击菜单栏的 工具 -> 实时语音翻译
  2. 配置语音识别

    • 在“语音识别渠道”中选择一个可用的渠道,例如 faster-whisper(本地,需模型)或 Google(在线,免费但需网络)。
    • 设置“原始语言”为您的输入语言(如中文)。
  3. 配置翻译

    • 在“翻译渠道”中选择一个支持日语的翻译服务,例如 Google翻译DeepLDeepSeek 等AI模型。
    • 设置“目标语言”为 日语 (ja)
  4. 配置配音

    • 在“配音渠道”中选择一个支持日语语音合成的服务,例如 Edge-TTS(免费,支持日语)或 OpenAI TTS
    • 在“配音角色”中选择一个日语发音角色(如 Edge-TTS 中的 ja-JP-NanamiNeural)。
  5. 设置输出设备

    • 在“输出设备”下拉菜单中,选择您的系统扬声器或耳机设备。
  6. 开始使用:点击“开始”按钮,对着麦克风说话,软件将自动完成识别->翻译->配音->播放的流程。

注意事项

  • 首次使用 faster-whisper 等本地模型需要下载对应模型文件,请确保网络通畅或已手动放置模型到 models/ 目录。
  • 如果使用在线服务(如Google识别、Edge-TTS),请确保网络连接正常。
  • 如果希望使用原音色克隆为日语,目前实时翻译功能可能不支持,需要进入主界面的视频翻译流程并配置声音克隆模型(如F5-TTS、Qwen-TTS的克隆模型)。

请查阅相关文档:

Post Your Reply
Open source and free maintenance is not easy. If this project is helpful to you, please consider making a small donation to help the project continue to maintain and update.

Related resource