#4825 生成的视频,带有原来的中文字幕(应该是视频本身带有硬字幕)。我想要把硬字幕去掉,换成翻译后的英文字幕

77.93* Posted at: 2 hours ago

生成的视频,带有原来的中文字幕(应该是视频本身带有硬字幕)。我想要把硬字幕去掉,换成翻译后的英文字幕

15 Replies

pyVideoTrans 无法去除视频中已有的硬字幕。硬字幕是直接嵌入在画面像素中的,本软件基于音频处理,不具备视频画面 OCR 或擦除功能。


解决方案

方案一:使用专用工具去除硬字幕(推荐)

  1. 使用开源工具 VideoSubCleanerRemove Logo Now 等对原始视频进行去硬字幕处理,得到无硬字幕的纯净视频。
  2. 将纯净视频作为输入,在 pyVideoTrans 中重新执行翻译并嵌入英文字幕。

方案二:覆盖原硬字幕区域(折衷)

如果无法完全去除,可以在 pyVideoTrans 的“修改硬字幕样式”中,将目标英文字幕放置在非硬字幕区域(例如画面底部),但原硬字幕仍会显示在画面中,可能造成重叠。

方案三:使用 GVS 工具提取并辅助替换

官方提供了另一款工具 本地离线提取视频硬字幕 ,可先提取原始中文字幕作为参考,但依然需要外部视频编辑软件去除硬字幕后再用本软件翻译。


请查阅相关文档:

生成的视频,只有视频,没有翻译后的字幕文件相关的

生成的视频中没有显示翻译后的字幕,最常见的原因是未正确选择字幕嵌入方式。请按以下步骤排查:

1. 确认主界面字幕嵌入选项

检查主界面第5行(音画同步及合成控制)的选项:

  • 不嵌入字幕:如果选中此项,视频中不会包含任何字幕。请改选 嵌入硬字幕嵌入软字幕
  • 嵌入软字幕:软字幕是独立轨道,部分播放器(如网页播放器)默认不显示,需要手动开启字幕轨道。建议选择 嵌入硬字幕 以确保字幕直接“烧录”在画面中。
  • (双):如果同时需要原文和译文,可勾选此项。

2. 检查输出文件夹

  • 默认输出目录为原视频所在目录下的 _video_out 文件夹。
  • 如果仍找不到字幕文件,请确认是否勾选了“清理已生成”重新处理一次,并观察处理过程中的日志是否提示“嵌入字幕”成功。

3. 如果仅缺少独立的 .srt 字幕文件

  • 本软件在处理过程中会自动生成原始语言和目标语言的字幕文件(位于 _video_out/视频名-后缀/ 下),文件名如 en.srt(源语言)、zh-cn.srt(目标语言)。
  • 如果视频翻译完成后没有自动保存这些 .srt 文件,请检查菜单栏 工具/选项 → 高级选项 中是否有“保留字幕文件”相关设置(默认应为保留)。若未保留,可重新执行一次并确保不选择“仅输出最终 mp4 视频”。

4. 特殊情况:使用已有字幕(如本地sr t)时

如果使用了“使用已有的SRT字幕文件”(知识库第13节),需确保字幕文件正确放入 _video_out/视频名-后缀/ 目录并命名为对应的语言代码(如 zh-cn.srt)。若命名错误则不会嵌入。

若以上步骤仍无法解决,请提供软件根目录下 logs/ 文件夹中最新的日志文件底部30行内容,以进一步分析。

【字幕配音调整】
并发配音线程数: 同时配音的线程数

配音后暂停秒: 每次配音后暂停秒数,用于限制请求频率

移除配音前后静音缓冲: 移除每条字幕配音前后静音缓冲,利于音画同步,但可能结尾仓促

保留每条字幕的配音文件: 保留每行字幕的配音结果

文本规范化: 配音前对文本规范化处理

高级选项上面的这些,是什么意思。我在高级选项里没有找到“保留字幕文件”

1. 各参数解释

  • 并发配音线程数:同时调用 TTS 接口进行配音的线程数量。值越大,配音生成越快,但可能导致限流或显存/内存不足(尤其 Edge-TTS)。建议设为 1 以避免 403 错误。
  • 配音后暂停秒:每次配音请求完成后,等待多少秒再发送下一条。主要用于控制请求频率,避免被 API 限流。默认或按渠道建议值设置即可。
  • 移除配音前后静音缓冲:去掉每条配音音频开头和结尾的静音部分。可以让字幕播放时切换更紧凑,有利于音画同步,但若静音不足可能导致说话开头或结尾被截断(听感突兀)。
  • 保留每条字幕的配音文件:如果勾选,处理完毕后会在临时目录中保留每条字幕对应的独立 .wav 配音音频文件,方便逐个检查或手动替换。不勾选则只留最终合并后的音频。
  • 文本规范化:在配音前对字幕文本进行标准化处理,例如数字、日期、符号的格式转换,使发音更准确(如 $100 读作 one hundred dollars 而非 dollar one hundred)。视渠道和语言支持情况而定。

2. 关于“保留字幕文件”

软件没有一个叫“保留字幕文件”的独立开关。视频翻译完成后,生成的 .srt 字幕文件默认都会保存在输出目录 _video_out/视频名-后缀/ 下(如 zh-cn.srten.srt)。如果你没有找到这些文件,请检查:

  • 是否勾选了主界面 “不嵌入字幕”?这种情况下软件依然会生成字幕文件(用于配音),除非你选择了仅输出最终 mp4
  • 输出目录是否被更改过?默认是原视频的 _video_out 文件夹。
  • 若仍无字幕文件,请提供日志文件底部 30 行,协助排查。

可以查看之前生成过的视频的翻译后的字幕吗

可以。每次翻译完成后,字幕文件会保存在原视频目录下的 _video_out 文件夹内。进入该文件夹,你会看到与视频同名的子目录(如 myvideo-mp4),翻译后的目标语言字幕文件即为对应语言代码的 .srt 文件(例如中方翻译成英文则为 en.srt)。直接双击用记事本或任何文本编辑器打开即可查看。

我在之前选择了仅输出mp4,不嵌入字幕。所以没看到任何字幕文件

由于您选择了“仅输出MP4”,软件在任务完成后会清理所有中间文件,包括SRT字幕文件和配音文件,最终只有MP4视频。这些字幕文件无法恢复

解决方案: 重新处理该视频,但取消勾选“仅输出MP4”,并选择一个字幕嵌入方式(例如“嵌入硬字幕”或“嵌入软字幕”)。勾选“清理已生成”以强制重新识别和翻译,完成后的字幕文件会保留在 _video_out/视频名-后缀/ 目录下。

在翻译视频或音频这里,恢复标点/识别说话人有什么作用,配音加速/视频慢速有什么作用,适合什么场景。我的视频是中文视频(达人介绍女性饰品,语速偏快),想转英文。这种情况下要怎么设置

恢复标点:语音识别后,自动补充标点符号(逗号、句号),使字幕更易读。适用于所有场景,建议开启。识别说话人:区分视频中不同的人声,并标注为说话人A/B等。仅当视频中有多人对话时有用;单人介绍视频无需开启。配音加速:当翻译后的英文配音时长超过原中文时长时,自动加速配音音频至与原时长匹配。适合配音偏长但希望保持画面同步的场景(如语速快的视频)。视频慢速:当配音偏长时,放慢对应视频片段的播放速度来等配音。会导致视频体积增大数倍且耗时较长,仅当配音无法加速或要求绝对同步时才考虑。针对你的场景(中文→英文,语速偏快):推荐设置- 开启恢复标点(提升字幕质量)- 关闭识别说话人(单人专场)- 开启音频加速(因英文配音通常更长,加速可自动对齐原视频)- 关闭视频慢速(避免体积膨胀)其他建议:主界面右上角勾选“二次识别”以进一步对齐字幕。若配音仍不同步,可在“设置更多参数”中调高“配音语速”或降低“最长语音持续秒数”至3-4秒。

中文翻译成英文,是否可以考虑到英文变长,适当得调整翻译后的英文和原来的中文在配音时使用的时长差距不大。以及,是否能让翻译后的英文地道而不是显得很学术生硬,不生活化。因为我的目的是让tiktok的东南亚客户或者美国客户看到视频有兴趣购买

针对你希望解决时长差异和翻译地道性的需求,以下是具体建议:

1. 控制英文配音时长与原文匹配

软件内置的「音频加速」会在配音后自动将过长的英文加速至与原中文时长一致,最终结果时长差距不大。具体操作:

  • 主界面勾选 音频加速(位于同步对齐区域)
  • 在「设置更多参数」中,可适当提高 配音语速(例如 +10%),让基础发音更快,减少需要强制加速的幅度,听感更自然。
  • 同时保持 视频慢速 关闭,避免体积膨胀。

2. 提升翻译的地道性与生活化

中文翻译成英文时,默认的机器翻译(如谷歌、微软)往往会输出直译、生硬的句子。推荐使用 AI智能翻译渠道(如DeepSeek、OpenAI ChatGPT),并在翻译术语表或提示词中引导风格:

  • 选择 DeepSeekOpenAI ChatGPT 渠道(需在菜单栏翻译设置中填入 API Key)
  • 翻译术语表 文本框中填写类似内容(一行一个规则):

    风格要求:使用口语化、生活化的英文,语句简洁有力,适合短视频销售场景。禁止使用正式学术词汇。
  • 启用「发送完整字幕」:让AI看到上下文,生成更连贯自然的译文。
  • 若使用 ChatGPT,可在其系统设置中添加类似描述(具体在菜单栏翻译设置 → OpenAI → 自定义Prompt)。

这样翻译出的英文会贴近 TikTok 口语风格,有效吸引东南亚/美国用户。

我有几十个视频,都自带硬字幕。目前的做法是现在pyvideotrans上翻译视频或音频,然后再到剪映去处理硬字幕并识别刚才翻译后的视频,添加英文字幕。整个过程耗时长(第一步翻译视频就耗时很长了),我是否可以快速识别音频或者提前音频字幕后批量得让你转成英文,然后再将英文音频与视频融合。或者你是否有好的建议,来让我提高效率

针对您几十个视频均带有硬字幕且需要转为英文的需求,核心瓶颈在于硬字幕无法自动去除。以下两个方案可大幅提升效率:

方案一(推荐):先批量去除硬字幕 → 再批量翻译

使用专业去硬字幕工具(如 VideoSubCleanerRemove Logo Now)对原始视频进行预处理,去除画面中永久嵌入的中文字幕。获得纯净视频后,在 pyVideoTrans 中勾选“文件夹”一次选择数十个视频,开启批量翻译(自动完成 ASR、翻译、配音、嵌入英文字幕)。此方案最彻底,且 pyVideoTrans 的批量处理速度远超逐一手动操作。

方案二:仅生成配音+字幕 → 在剪映中覆盖硬字幕并合成

  1. 在 pyVideoTrans 中勾选:

    • “不嵌入字幕”(不给视频加字幕)
    • “仅输出MP4”(只保留最终合成视频,但音频已被替换为英文配音)
    • 菜单→工具→高级选项→字幕配音调整中勾选“保留每条字幕的配音文件”(可选,便于在剪映中逐句校对)
  2. 处理完成后得到 仅替换了英文配音但无字幕的 MP4 以及独立的英文字幕 .srt 文件。
  3. 将该 MP4 和 .srt 字幕导入剪映。在剪映中:

    • “识别字幕” 功能先识别出原始视频硬字幕(剪映会生成字幕轨道)。
    • 在轨道上删除或遮盖该硬字幕轨道(例如添加一个不透明色块覆盖原硬字幕区域)。
    • 导入外部的 .srt 英文字幕轨道。
      只需处理一次模板,然后复制给其他视频,批量操作效率远高于逐一手动处理。

为什么推荐方案一?
方案二仍需在剪映中对每个视频进行遮盖/删除硬字幕操作,尽管比原来省去了重新配音和字幕翻译步骤,但去硬字幕仍需手动干预。方案一直接对原视频脱硬字幕,之后 pyVideoTrans 完全可以无人值守批量完成。

效率对比:

操作原流程方案一方案二
去硬字幕手动在剪映逐个遮盖一键预处理(批量)在剪映逐个遮盖
语音识别/翻译pyVideoTranspyVideoTrans批量省去(直接用pyVideoTrans结果)
配音/合成pyVideoTranspyVideoTrans批量pyVideoTrans完成
最终字幕剪映逐个添加pyVideoTrans自动嵌入导入外挂字幕
总耗时最短次之

注意点:

  • 若使用方案一,请确保去硬字幕工具能处理您的视频格式(mp4/mkv等),且不影响画质。
  • 若使用方案二,pyVideoTrans 翻译时请开启“音频加速”(英文通常更长),并选择 AI 翻译渠道(如 DeepSeek)以确保英文口语化、适合 TikTok 场景。
Post Your Reply
Open source and free maintenance is not easy. If this project is helpful to you, please consider making a small donation to help the project continue to maintain and update.

Related resource