要实现“保留视频部分原声,其他部分翻译配音”的效果,您需要使用 pyVideoTrans 的 字幕多角色配音 功能。该功能允许您为字幕文件(SRT)的每一行指定不同的发音人,包括“保持原声”。
以下是详细的操作步骤:
核心步骤:
- 生成原始字幕:首先,使用软件对您的视频进行完整的语音识别,生成原始语言的字幕文件(SRT格式)。
- 编辑字幕并指定角色:在生成的 SRT 文件中,为您希望保留原声的字幕行指定一个特殊的“保持原声”角色,为需要翻译配音的行指定您想要的配音角色。
- 执行多角色配音:使用“字幕多角色配音”工具,导入编辑好的 SRT 文件,软件会根据您的指定,对不同的字幕行使用原声或合成配音,最终生成一个混合音频。
具体操作流程:
第一步:生成原始字幕
- 在主界面,导入您的视频。
- 在 第2行(语音识别) 选择识别模型(如
faster-whisper),并正确设置“发音语言”。 - 在 第3行(翻译设置) 的“目标语言”中,选择与“发音语言”相同的语言(例如,原视频是英文,这里也选英文)。这一步至关重要,目的是只生成字幕,不进行翻译。
- 取消勾选第4行(配音)的所有选项,确保不进行配音。
- 点击“开始”按钮。软件会识别语音并生成原始语言的 SRT 字幕文件。处理完成后,会在原视频目录下的
_video_out 文件夹中找到 .srt 文件。
第二步:编辑字幕文件,指定发音角色
- 用记事本或其他文本编辑器打开上一步生成的
.srt 文件。 您会看到类似以下格式的内容:
1
00:00:01,000 --> 00:00:04,000
这是第一句原话。
2
00:00:05,000 --> 00:00:08,000
这是第二句原话。
- 在您希望保留原声的那一行字幕的文本末尾,添加一个特殊标记
[#no]。 在您希望进行翻译配音的那一行字幕的文本末尾,添加您想要的配音角色名,格式为 [#角色名]。角色名必须与软件配音角色列表中的名称完全一致(例如 [#zh-CN-XiaoxiaoNeural])。
示例(假设第一句保留原声,第二句用“晓晓”配音):
1
00:00:01,000 --> 00:00:04,000
这是第一句原话。[#no]
2
00:00:05,000 --> 00:00:08,000
这是第二句原话。[#zh-CN-XiaoxiaoNeural]
- 保存修改后的 SRT 文件。
第三步:使用“字幕多角色配音”工具
- 在软件主界面,点击顶部菜单栏的 “工具箱”。
- 选择 “字幕多角色配音”。
在打开的工具窗口中:
- 视频/音频文件:选择您的原始视频文件。
- 字幕文件:选择您刚才编辑好的、带有角色标记的 SRT 文件。
- 目标语言:选择您最终需要的配音语言(例如中文)。
- 配音角色:这里选择的角色将作为默认角色,用于那些没有在 SRT 文件中指定特定角色的字幕行。由于您已经全部指定,这里可以任选。
- 根据需要设置输出格式、是否嵌入字幕等选项。
- 点击“开始合成”。软件会读取您的 SRT 文件,对标记了
[#no] 的行保留视频原声片段,对标记了配音角色的行进行翻译和语音合成,最后将所有音频片段与视频合并。
注意事项:
- 翻译问题:在第二步中,您只生成了原文字幕,没有翻译。在第三步“字幕多角色配音”时,软件会自动对需要配音的字幕行进行翻译(根据您选择的“目标语言”)。
- 角色名准确性:
[#角色名] 中的角色名必须完全正确。您可以在主界面的配音角色下拉列表中查看准确的名称。 - 时间轴:确保 SRT 文件中的时间轴准确,否则会导致音画不同步。
通过以上步骤,您就可以实现视频部分原声、部分翻译配音的混合效果。
请查看更多参考文档: