#3690 如何让视频制作出来有情感，字母和原文一致

59.51* Posted at: 4 months ago

如何让视频制作出来有情感，字母和原文一致

1 Replies

Floor #1 DeepSeek reply at 4 months ago

要让视频翻译后的配音有情感，并且字幕与原文一致，核心在于优化配音渠道的选择和配置，并确保字幕翻译的准确性。

实现配音有情感：
- 选择支持情感合成的配音渠道：避免使用纯机械的TTS。推荐使用支持情感或声音克隆的渠道，例如：
  - F5-TTS、GPT-SoVITS、CosyVoice：这些本地部署的渠道支持声音克隆，可以模仿原视频说话人的音色和语调，从而保留情感。
  - Edge-TTS（免费）：微软的免费渠道，其部分角色发音自然度较高。
  - 商业API：如OpenAI TTS、Azure TTS、字节火山语音、阿里 Qwen-TTS等，通常提供更高质量、更具表现力的语音。
- 使用“克隆”角色：如果希望配音音色与原视频一致，在选择了上述支持克隆的配音渠道后，在“配音角色”下拉菜单中选择 clone。这需要原视频有清晰的人声，软件会自动提取对应片段的音频作为参考。
- 启用“分离人声背景声”：如果选择了 clone 角色，务必在主界面点击“设置更多参数...”，然后勾选 分离人声背景声。这能提供更干净的人声参考，提升克隆质量。
- 调整高级参数：为了给克隆提供合适的参考音频片段，需进入菜单 -> 工具 -> 高级选项 -> 语音识别参数，进行如下设置：
  - 最短语音持续毫秒 设为 3000。
  - 最长语音持续秒数 设为 10。
  - 勾选 Whisper预分割音频? 和 合并过短字幕到邻近。
确保字幕与原文一致：
- 提高翻译质量：字幕准确性取决于翻译渠道。
  - 首选AI大模型：如 DeepSeek、ChatGPT (GPT-4o)、Gemini，它们对上下文的理解更好，翻译更准确。
  - 利用完整上下文：在翻译阶段，勾选 发送完整字幕。同时，在菜单 -> 工具 -> 高级选项 -> 字幕翻译调整中，勾选 AI翻译附带完整原字幕，并将 AI翻译渠道每批字幕行数 设为一个较大的值（如100）。这能让AI模型看到完整的对话上下文，做出更连贯、准确的翻译。
- 开启“二次识别”：翻译并生成配音后，配音时长可能与原字幕时间轴有差异。在主界面勾选 二次识别 选项。软件会对生成的新配音音频再次进行语音识别，生成与配音精确对齐的新字幕，确保最终视频里的字幕和听到的配音内容完全一致。

请查阅相关文档：