#3810 请求更新支持游戏音频转音色AI

205.185* Posted at: 3 hours ago 👁7

需要兼容游戏音频的配音输出,目前提取游戏的音频可以转录字幕,但是无法自动翻译,也无法直接自动化输出其他音色的ogg音频文件

1 Replies

pyVideoTrans 的核心功能是视频/音频的语音识别、字幕翻译和语音合成,其工作流程基于“音频 -> 字幕 -> 翻译 -> 配音”的通用模式。您提到的“游戏音频转音色”并输出特定格式(如ogg)的自动化需求,目前软件无法直接满足。

核心原因与现状分析:

  1. 翻译功能:软件支持字幕翻译。如果您的游戏音频已成功转录为字幕,可以在“翻译视频或音频”界面中选择翻译渠道进行翻译。
  2. 配音与音色:软件支持多种TTS渠道进行配音,包括声音克隆(如F5-TTS、GPT-SoVITS、CosyVoice),可以将翻译后的文本合成为新音色的音频。
  3. 格式输出限制:软件最终的音频输出格式主要服务于视频合成(如嵌入到MP4中)。虽然中间会生成WAV格式的配音文件,但不支持直接、自动化地输出为OGG格式。您需要手动使用其他工具进行格式转换。
  4. 自动化流程缺口:软件设计并非专门针对“游戏音频->特定格式配音文件”的流水线。要实现“自动翻译并直接输出OGG”,需要对现有工作流进行定制化修改或开发新脚本。

解决方案(基于现有功能):

  1. 转录字幕:使用“批量语音转字幕”功能,将游戏音频转为SRT字幕。
  2. 翻译字幕:使用“批量翻译SRT字幕”功能,或导入字幕到“翻译视频或音频”界面进行翻译。
  3. 生成配音:使用“批量为字幕配音”功能,选择目标语言和配音角色(包括克隆角色),生成WAV格式的配音音频文件。
  4. 格式转换:使用软件内置的“工具集 -> 音频视频格式转换”功能,将生成的WAV配音文件转换为OGG格式。注意:这需要您手动操作,无法在视频翻译主流程中自动完成。

关于功能更新建议:
pyVideoTrans是一款开源免费软件,功能更新取决于社区需求和开发者精力。您可以将“支持直接输出OGG等指定格式的配音音频”作为功能请求,提交到项目的GitHub Issues页面,供开发者评估。

请查阅相关文档:

Post Your Reply
Open source and free maintenance is not easy. If this project is helpful to you, please consider making a small donation to help the project continue to maintain and update.

Related resource