#4080 配音不根据我提供的字幕配

95.85* Posted at: 5 days ago 👁110

配音不根据我提供的字幕配,导致成品视频配音混乱。

19 Replies

这是由于软件默认启用了缓存机制,直接使用了之前生成的缓存字幕文件,而非您新提供的字幕。

解决方案:

  1. 在主界面左上角,勾选 “清理已生成” 复选框。
  2. 重新选择视频文件并导入您提供的字幕文件进行处理。

请查阅相关文档:

并不是根据之前的缓存字幕配的,是部分配音正确,部分配音错误。

这是由于配音过程中,字幕与音频片段的时间轴匹配出现了偏差。这通常发生在字幕文件与视频的语音内容不完全对应,或者软件在分割音频时产生了错位。

解决方案:

  1. 检查字幕文件:确保您提供的字幕文件(SRT格式)与视频的语音内容完全匹配,时间轴准确。
  2. 调整语音识别参数:如果字幕是软件自动生成的,请尝试调整语音识别参数以提高准确性。

    • 进入 菜单 -> 工具/选项 -> 高级选项
    • 【语音识别参数】 区域,尝试调整以下参数:

      • 语音阈值:适当提高(如设为0.6),减少噪音干扰。
      • 最长语音持续秒数:适当减小(如设为5),避免过长的音频片段。
      • 静音分割持续毫秒:适当增大(如设为700),确保在足够的静音处分割。
  3. 使用“单视频交互模式”:在翻译单个视频时,软件会在配音后弹出编辑窗口。您可以在此窗口中手动校对和调整每句配音的开始/结束时间,或重新生成特定句子的配音。
  4. 开启“二次识别”:如果您在最终视频中需要嵌入字幕,请在主界面勾选 二次识别。这会在配音完成后,对生成的配音音频再次进行语音识别,生成与配音精确匹配的新字幕,确保字幕和声音对齐。
  5. 检查配音渠道设置:如果使用的是 Edge-TTS 等免费渠道,并发过高可能导致部分请求失败或返回错误内容。请在 高级选项【字幕配音调整】 区域,将 并发配音线程数 设为 1,并将 配音后暂停秒 设为 5 或更高。

请查阅相关文档:

如何让他完全按照我提供的字幕进行配音?

要完全按照您提供的字幕进行配音,必须确保软件跳过语音识别步骤,直接使用您的字幕文件。请按以下步骤操作:

  1. 导入字幕:在主界面,点击 选择音频或视频 按钮,选择您的视频文件。然后,在视频文件选择框下方的文本区域,直接粘贴您的字幕内容(SRT格式),或者点击旁边的 导入SRT 按钮导入您的字幕文件。
  2. 跳过语音识别:在 语音识别 下拉列表中,选择 不进行语音识别 选项。这将强制软件使用您提供的字幕,而不会对视频进行语音识别生成新字幕。
  3. 配置后续步骤:正常设置 翻译渠道目标语言配音渠道配音角色 等选项。
  4. 开始处理:点击 开始 按钮。软件将直接基于您提供的字幕进行翻译(如果设置了翻译)和配音。

关键点:确保 语音识别 渠道已设置为 不进行语音识别,并且字幕内容已正确导入。这样,整个流程将完全基于您的字幕文件进行。

请查阅相关文档:

语音识别下拉没有 不进行语音识别

这是由于界面选项名称不直观造成的。要跳过语音识别,您需要选择 None 选项。具体操作如下:在 语音识别 下拉列表中,滚动到列表的最顶部或最底部,找到名为 None不识别 的选项并选中它。此选项表示跳过语音识别步骤。导入您的字幕文件:点击 选择音频或视频 选择视频,然后在下方文本框中粘贴字幕内容或点击 导入SRT 按钮。后续步骤正常设置翻译和配音。开始处理。这样,软件将完全基于您提供的字幕进行后续的翻译和配音,不会调用任何语音识别模型。

你说的这几个选项都没有。

这是由于软件版本或界面翻译差异导致。请按以下步骤强制软件使用您提供的字幕:确保字幕已导入:在主界面,点击 选择音频或视频 按钮,选择您的视频文件。然后,在视频文件选择框下方的文本区域,直接粘贴您的字幕内容(SRT格式),或者点击旁边的 导入SRT 按钮导入您的字幕文件。选择任意语音识别渠道:在 语音识别 下拉列表中,任意选择一个渠道(例如 faster-whisper(本地))。勾选 清理已生成:在主界面左上角,勾选 清理已生成 复选框。这将确保软件重新处理,而不是使用任何缓存。开始处理:点击 开始 按钮。关键原理:当软件检测到您已手动导入了字幕内容时,它会优先使用您提供的字幕,而跳过实际的语音识别步骤。您选择的语音识别渠道实际上不会被调用。请查阅相关文档:使用本地已有的“srt字幕文件”

可不可以选择一个我没有下载的模型,然后不配置,在进行生成视频,这样还会识别吗?

是的,可以。这是强制软件跳过语音识别、直接使用您提供字幕的有效方法。具体操作如下:选择未下载的模型:在 语音识别 下拉列表中,选择一个您确定没有下载过的模型(例如,如果您从未下载过 qwen-asr(本地),就选择它)。确保字幕已导入:在主界面,点击 选择音频或视频 选择视频,然后在下方文本框中粘贴字幕内容或点击 导入SRT 按钮。勾选 清理已生成:在主界面左上角,勾选 清理已生成 复选框。开始处理:点击 开始 按钮。关键原理:当软件尝试加载一个不存在的本地模型时,会因无法初始化而跳过实际的语音识别步骤。同时,由于您已导入了字幕,软件会转而使用您提供的字幕进行后续流程。这样就能实现“完全按提供字幕配音”的目的。

就算跳过了还是很多错误,例如:au treffois → 正确:autrefois(昔日)
quelqu'un → 正确:quelques-uns(几座)
habits insensables → 正确:abysses insondables(深渊)
直接变成 “沉没在没感觉的衣服里”,极度搞笑
quel est catastrophé → 正确:quelle catastrophe
vestie → 正确:vestiges(废墟)

这是由于翻译渠道的翻译质量不佳,特别是对于法语等小语种,传统翻译或小型AI模型处理能力有限。解决方案是更换为更强大的AI翻译模型。解决方案:更换翻译渠道:在 翻译渠道 下拉列表中,选择 AI智能翻译 类别下的渠道,例如 DeepSeek、ChatGPT (OpenAI)、Gemini 或 Claude。这些大模型对法语和复杂语境的理解能力远强于传统翻译。配置AI渠道:点击 菜单 -> 翻译设置,在对应渠道的设置面板中填写正确的 API URL 和 API Key。优化翻译设置:在 菜单 -> 工具/选项 -> 高级选项 的 【字幕翻译调整】 区域,进行以下设置以提高质量:AI翻译渠道每批字幕行数:设置为 50 或更大(如100),让AI获得更多上下文。发送完整字幕:勾选此项,并将 高级选项 中的 AI翻译附带完整原字幕 也勾选上。这会将带时间轴的完整字幕发送给AI,利用上下文极大提升准确度。翻译后暂停秒:适当增加(如3秒),避免请求过快被限流。使用术语表:如果视频涉及特定领域词汇,可在主界面的 翻译术语表 中填写关键术语及其正确翻译,AI会优先采用。最佳实践:对于法语视频翻译,强烈建议使用 DeepSeek-V3、GPT-4o 或 Gemini 1.5 Pro 等支持超长上下文的最新模型,并启用“发送完整字幕”功能。请查阅相关文档:如何选择翻译渠道使用AI翻译文档DeepSeek AI模型接入

omnivoice可以吗?

OmniVoice-TTS 是配音渠道,不是翻译渠道。它无法解决您遇到的翻译错误问题。您当前的问题是翻译结果错误(如将法语词汇翻译成荒谬的中文),这必须通过更换或优化翻译渠道来解决。解决方案:区分功能:OmniVoice-TTS:仅负责将已经翻译好的文字合成为语音(配音)。它不参与翻译过程。翻译渠道:负责将原始语言字幕(如法语)转换为目标语言字幕(如中文)。您需要优化的是这一步。操作步骤:按照上一条回复,将 翻译渠道 更换为强大的AI模型(如 DeepSeek、ChatGPT)。在 配音渠道 中,您可以选择 OmniVoice-TTS 来生成高质量的配音。总结:先用强大的AI翻译渠道(如DeepSeek)获得准确的中文字幕。再用OmniVoice-TTS或其他配音渠道为准确的中文字幕生成语音。请查阅相关文档:OmniVoice-TTS配音渠道如何选择翻译渠道

哪种翻译渠道是免费的?

免费的翻译渠道主要有以下几类,但请注意,免费渠道在处理复杂法语文本时准确度可能有限:传统免费翻译:Google翻译:需配置网络代理才能在中国大陆使用。微软翻译 (Bing):无需代理,但效果一般。M2M100 (本地):需下载模型,完全本地运行,但翻译质量一般,尤其对小语种支持不佳。DeepLX:需自行部署本地服务,效果较好,但部署较复杂。AI智能翻译(部分有免费额度):DeepSeek:提供免费API额度,翻译质量高,强烈推荐。需注册获取API Key。硅基流动、智谱AI、302.AI 等:通常有新用户免费额度,用完后需付费。重要建议:对于您遇到的复杂法语翻译,强烈建议使用 DeepSeek(免费且质量高)。请按以下步骤操作:注册 DeepSeek 平台并获取 API Key。在软件中,选择 翻译渠道 为 DeepSeek。点击 菜单 -> 翻译设置 -> DeepSeek设置,填写 API Key。在 高级选项 中,勾选 发送完整字幕 和 AI翻译附带完整原字幕,并将 AI翻译渠道每批字幕行数 设为一个较大的值(如100)。这样能最大程度利用其上下文理解能力,提高翻译准确度。请查阅相关文档:DeepSeek AI模型接入如何选择翻译渠道

3.98版本是不是可以免费试用DeepSeek翻译渠道,我没有配置过,但是点开设置发现配置好了。

是的,v3.98 版本内置了 DeepSeek 翻译渠道的试用配置。您可以直接使用,但请注意:试用额度有限:内置的 API Key 是公用的,有并发和额度限制,可能很快用完或被他人用尽导致失败。效果可能不稳定:由于是公共密钥,请求过多时可能被限流或返回错误。最佳实践:尽快注册您自己的 DeepSeek 账户,获取个人专属的 API Key。在软件中,点击 菜单 -> 翻译设置 -> DeepSeek设置,将您自己的 API Key 填入并保存。这样能获得稳定、高质量的翻译服务。请查阅相关文档:DeepSeek AI模型接入

Post Your Reply
Open source and free maintenance is not easy. If this project is helpful to you, please consider making a small donation to help the project continue to maintain and update.

Related resource

Similar issues already exist