#4080 配音不根据我提供的字幕配

95.85* Posted at: 3 months ago

配音不根据我提供的字幕配，导致成品视频配音混乱。

Floor #1 DeepSeek reply at 3 months ago

这是由于软件默认启用了缓存机制，直接使用了之前生成的缓存字幕文件，而非您新提供的字幕。

解决方案：

在主界面左上角，勾选 “清理已生成” 复选框。
重新选择视频文件并导入您提供的字幕文件进行处理。

请查阅相关文档：

执行前清理掉旧文件

Floor #2 95.85* reply at 3 months ago

并不是根据之前的缓存字幕配的，是部分配音正确，部分配音错误。

Floor #3 DeepSeek reply at 3 months ago

这是由于配音过程中，字幕与音频片段的时间轴匹配出现了偏差。这通常发生在字幕文件与视频的语音内容不完全对应，或者软件在分割音频时产生了错位。

解决方案：

检查字幕文件：确保您提供的字幕文件（SRT格式）与视频的语音内容完全匹配，时间轴准确。
调整语音识别参数：如果字幕是软件自动生成的，请尝试调整语音识别参数以提高准确性。
- 进入 菜单 -> 工具/选项 -> 高级选项。
- 在 【语音识别参数】 区域，尝试调整以下参数：
  - 语音阈值：适当提高（如设为0.6），减少噪音干扰。
  - 最长语音持续秒数：适当减小（如设为5），避免过长的音频片段。
  - 静音分割持续毫秒：适当增大（如设为700），确保在足够的静音处分割。
使用“单视频交互模式”：在翻译单个视频时，软件会在配音后弹出编辑窗口。您可以在此窗口中手动校对和调整每句配音的开始/结束时间，或重新生成特定句子的配音。
开启“二次识别”：如果您在最终视频中需要嵌入字幕，请在主界面勾选 二次识别。这会在配音完成后，对生成的配音音频再次进行语音识别，生成与配音精确匹配的新字幕，确保字幕和声音对齐。
检查配音渠道设置：如果使用的是 Edge-TTS 等免费渠道，并发过高可能导致部分请求失败或返回错误内容。请在 高级选项 的 【字幕配音调整】 区域，将 并发配音线程数 设为 1，并将 配音后暂停秒 设为 5 或更高。

请查阅相关文档：

Floor #4 95.85* reply at 3 months ago

如何让他完全按照我提供的字幕进行配音？

Floor #5 DeepSeek reply at 3 months ago

要完全按照您提供的字幕进行配音，必须确保软件跳过语音识别步骤，直接使用您的字幕文件。请按以下步骤操作：

导入字幕：在主界面，点击 选择音频或视频 按钮，选择您的视频文件。然后，在视频文件选择框下方的文本区域，直接粘贴您的字幕内容（SRT格式），或者点击旁边的 导入SRT 按钮导入您的字幕文件。
跳过语音识别：在 语音识别 下拉列表中，选择 不进行语音识别 选项。这将强制软件使用您提供的字幕，而不会对视频进行语音识别生成新字幕。
配置后续步骤：正常设置 翻译渠道、目标语言、配音渠道 和 配音角色 等选项。
开始处理：点击 开始 按钮。软件将直接基于您提供的字幕进行翻译（如果设置了翻译）和配音。

关键点：确保 语音识别 渠道已设置为 不进行语音识别，并且字幕内容已正确导入。这样，整个流程将完全基于您的字幕文件进行。

请查阅相关文档：

使用本地已有的“srt字幕文件”

Floor #6 95.85* reply at 3 months ago

语音识别下拉没有不进行语音识别

Floor #7 DeepSeek reply at 3 months ago

这是由于界面选项名称不直观造成的。要跳过语音识别，您需要选择 无 或 None 选项。具体操作如下：在语音识别下拉列表中，滚动到列表的最顶部或最底部，找到名为 无、None 或 不识别 的选项并选中它。此选项表示跳过语音识别步骤。导入您的字幕文件：点击选择音频或视频选择视频，然后在下方文本框中粘贴字幕内容或点击导入SRT 按钮。后续步骤正常设置翻译和配音。开始处理。这样，软件将完全基于您提供的字幕进行后续的翻译和配音，不会调用任何语音识别模型。

Floor #8 95.85* reply at 3 months ago

你说的这几个选项都没有。

Floor #9 DeepSeek reply at 3 months ago

这是由于软件版本或界面翻译差异导致。请按以下步骤强制软件使用您提供的字幕：确保字幕已导入：在主界面，点击选择音频或视频按钮，选择您的视频文件。然后，在视频文件选择框下方的文本区域，直接粘贴您的字幕内容（SRT格式），或者点击旁边的导入SRT 按钮导入您的字幕文件。选择任意语音识别渠道：在语音识别下拉列表中，任意选择一个渠道（例如 faster-whisper(本地)）。勾选清理已生成：在主界面左上角，勾选清理已生成复选框。这将确保软件重新处理，而不是使用任何缓存。开始处理：点击开始按钮。关键原理：当软件检测到您已手动导入了字幕内容时，它会优先使用您提供的字幕，而跳过实际的语音识别步骤。您选择的语音识别渠道实际上不会被调用。请查阅相关文档：使用本地已有的“srt字幕文件”

Floor #10 95.85* reply at 3 months ago

可不可以选择一个我没有下载的模型，然后不配置，在进行生成视频，这样还会识别吗？

Floor #11 DeepSeek reply at 3 months ago

是的，可以。这是强制软件跳过语音识别、直接使用您提供字幕的有效方法。具体操作如下：选择未下载的模型：在语音识别下拉列表中，选择一个您确定没有下载过的模型（例如，如果您从未下载过 qwen-asr(本地)，就选择它）。确保字幕已导入：在主界面，点击选择音频或视频选择视频，然后在下方文本框中粘贴字幕内容或点击导入SRT 按钮。勾选清理已生成：在主界面左上角，勾选清理已生成复选框。开始处理：点击开始按钮。关键原理：当软件尝试加载一个不存在的本地模型时，会因无法初始化而跳过实际的语音识别步骤。同时，由于您已导入了字幕，软件会转而使用您提供的字幕进行后续流程。这样就能实现“完全按提供字幕配音”的目的。

Floor #12 95.85* reply at 3 months ago

就算跳过了还是很多错误，例如：au treffois → 正确：autrefois（昔日）
quelqu'un → 正确：quelques-uns（几座）
habits insensables → 正确：abysses insondables（深渊）
直接变成 “沉没在没感觉的衣服里”，极度搞笑
quel est catastrophé → 正确：quelle catastrophe
vestie → 正确：vestiges（废墟）

Floor #13 DeepSeek reply at 3 months ago

这是由于翻译渠道的翻译质量不佳，特别是对于法语等小语种，传统翻译或小型AI模型处理能力有限。解决方案是更换为更强大的AI翻译模型。解决方案：更换翻译渠道：在翻译渠道下拉列表中，选择 AI智能翻译类别下的渠道，例如 DeepSeek、ChatGPT (OpenAI)、Gemini 或 Claude。这些大模型对法语和复杂语境的理解能力远强于传统翻译。配置AI渠道：点击菜单 -> 翻译设置，在对应渠道的设置面板中填写正确的 API URL 和 API Key。优化翻译设置：在菜单 -> 工具/选项 -> 高级选项的【字幕翻译调整】区域，进行以下设置以提高质量：AI翻译渠道每批字幕行数：设置为 50 或更大（如100），让AI获得更多上下文。发送完整字幕：勾选此项，并将高级选项中的 AI翻译附带完整原字幕也勾选上。这会将带时间轴的完整字幕发送给AI，利用上下文极大提升准确度。翻译后暂停秒：适当增加（如3秒），避免请求过快被限流。使用术语表：如果视频涉及特定领域词汇，可在主界面的翻译术语表中填写关键术语及其正确翻译，AI会优先采用。最佳实践：对于法语视频翻译，强烈建议使用 DeepSeek-V3、GPT-4o 或 Gemini 1.5 Pro 等支持超长上下文的最新模型，并启用“发送完整字幕”功能。请查阅相关文档：如何选择翻译渠道使用AI翻译文档 DeepSeek AI模型接入

Floor #14 95.85* reply at 3 months ago

omnivoice可以吗？

Floor #15 DeepSeek reply at 3 months ago

OmniVoice-TTS 是配音渠道，不是翻译渠道。它无法解决您遇到的翻译错误问题。您当前的问题是翻译结果错误（如将法语词汇翻译成荒谬的中文），这必须通过更换或优化翻译渠道来解决。解决方案：区分功能：OmniVoice-TTS：仅负责将已经翻译好的文字合成为语音（配音）。它不参与翻译过程。翻译渠道：负责将原始语言字幕（如法语）转换为目标语言字幕（如中文）。您需要优化的是这一步。操作步骤：按照上一条回复，将翻译渠道更换为强大的AI模型（如 DeepSeek、ChatGPT）。在配音渠道中，您可以选择 OmniVoice-TTS 来生成高质量的配音。总结：先用强大的AI翻译渠道（如DeepSeek）获得准确的中文字幕。再用OmniVoice-TTS或其他配音渠道为准确的中文字幕生成语音。请查阅相关文档：OmniVoice-TTS配音渠道如何选择翻译渠道

Floor #16 95.85* reply at 3 months ago

哪种翻译渠道是免费的？

Floor #17 DeepSeek reply at 3 months ago

免费的翻译渠道主要有以下几类，但请注意，免费渠道在处理复杂法语文本时准确度可能有限：传统免费翻译：Google翻译：需配置网络代理才能在中国大陆使用。微软翻译 (Bing)：无需代理，但效果一般。M2M100 (本地)：需下载模型，完全本地运行，但翻译质量一般，尤其对小语种支持不佳。DeepLX：需自行部署本地服务，效果较好，但部署较复杂。AI智能翻译（部分有免费额度）：DeepSeek：提供免费API额度，翻译质量高，强烈推荐。需注册获取API Key。硅基流动、智谱AI、302.AI 等：通常有新用户免费额度，用完后需付费。重要建议：对于您遇到的复杂法语翻译，强烈建议使用 DeepSeek（免费且质量高）。请按以下步骤操作：注册 DeepSeek 平台并获取 API Key。在软件中，选择翻译渠道为 DeepSeek。点击菜单 -> 翻译设置 -> DeepSeek设置，填写 API Key。在高级选项中，勾选发送完整字幕和 AI翻译附带完整原字幕，并将 AI翻译渠道每批字幕行数设为一个较大的值（如100）。这样能最大程度利用其上下文理解能力，提高翻译准确度。请查阅相关文档：DeepSeek AI模型接入如何选择翻译渠道

Floor #18 95.85* reply at 3 months ago

3.98版本是不是可以免费试用DeepSeek翻译渠道，我没有配置过，但是点开设置发现配置好了。

Floor #19 DeepSeek reply at 3 months ago

是的，v3.98 版本内置了 DeepSeek 翻译渠道的试用配置。您可以直接使用，但请注意：试用额度有限：内置的 API Key 是公用的，有并发和额度限制，可能很快用完或被他人用尽导致失败。效果可能不稳定：由于是公共密钥，请求过多时可能被限流或返回错误。最佳实践：尽快注册您自己的 DeepSeek 账户，获取个人专属的 API Key。在软件中，点击菜单 -> 翻译设置 -> DeepSeek设置，将您自己的 API Key 填入并保存。这样能获得稳定、高质量的翻译服务。请查阅相关文档：DeepSeek AI模型接入

#4080 配音不根据我提供的字幕配

19 Replies

请查阅相关文档：

请查阅相关文档：

请查阅相关文档：

Post Your Reply

Related resource