#1050 srt翻译字幕处理失败

117.152* Posted at: 8 months ago

批量转换字幕功能转换单个srt字幕时最后生成中英文字幕失败，看中间过程，基本上字幕都是成功转换的，有中英文，但是最后一下处理的时候只有前面200行有中英文，后面的翻译丢失，尝试多次君这个情形。

Floor #1 DeepSeek reply at 8 months ago

您遇到的“批量翻译SRT字幕”功能在最后处理阶段丢失部分翻译内容的问题，通常与AI翻译模型的输出格式或处理逻辑有关。请按照以下步骤尝试解决：

检查并修改翻译设置：
- 在软件主界面，进入 菜单 -> 翻译设置。
- 如果您使用的是本地部署的AI模型（如Ollama等），请尝试切换到更稳定的在线模型，例如 Google、Microsoft 或 DeepSeek。在线大模型通常对长文本的处理更可靠。
调整高级选项（关键步骤）：
- 进入 菜单 -> 工具/选项 -> 高级选项。
- 在“翻译”区域，进行以下两项设置：
  - 将 “同时翻译的字幕行数” 设置为 1。
  - 取消勾选 “发送完整字幕文本给AI”。
- 这两项设置可以强制翻译引擎逐行处理字幕，避免因一次性发送过多内容导致模型输出格式混乱或截断。
重新尝试翻译：
- 完成上述设置后，再次使用“批量翻译SRT字幕”功能处理您的文件。

如果问题依旧存在，请提供 软件根目录/logs/ 文件夹下最新的日志文件（以日期命名的 .log 文件），以便进行更深入的分析。

Floor #2 117.152* reply at 8 months ago

使用gemini 2.5 flash按道理模型深度还可以呀

Floor #3 DeepSeek reply at 8 months ago

您使用的 Gemini 2.5 Flash 模型能力确实很强，但问题可能出在软件与AI模型交互的配置上，导致在处理大批量字幕行时，模型的输出格式或内容被错误地解析或截断。

请立即尝试以下针对性解决方案：

调整高级翻译选项（最关键）：
- 进入 菜单 -> 工具/选项 -> 高级选项。
- 在“翻译”区域，进行以下两项设置：
  - 将 “同时翻译的字幕行数” 设置为 1。这可以避免因并发请求导致响应混乱。
  - 取消勾选 “发送完整字幕文本给AI”。这个选项有时会导致AI模型返回的文本结构不符合预期，从而在后续解析时丢失部分内容。
检查并优化提示词（Prompt）：
- 在 菜单 -> 翻译设置 中，找到您配置的Gemini渠道。
- 检查其中的“系统提示词”或相关设置，确保它是一个清晰、严格的指令，要求模型必须返回与原文行数、时间戳完全对应的纯字幕文本，不要添加任何额外的解释、编号或标记。

完成以上设置后，请重新尝试批量翻译。如果问题仍然出现，请提供 软件根目录/logs/ 文件夹下最新的日志文件，这对于定位解析环节的具体错误至关重要。

Floor #4 117.152* reply at 8 months ago

能不能直接保留以及整合中间的字幕，最后自己处理微调，现在是最后一下剩下的翻译直接没了

Floor #5 DeepSeek reply at 8 months ago

您希望保留中间生成的字幕文件以避免最终合并时丢失翻译，这是一个非常实用的需求。软件的处理流程中确实会生成这些中间文件，您可以按以下步骤手动整合：

定位中间文件：
- 在您选择的 输出文件夹 中，软件会为每个任务生成一个临时工作目录，通常以任务名或时间戳命名。
- 在此目录内，您应该能找到两个关键的 .srt 文件：
  - {原名}_raw.srt：这是语音识别后生成的 原始语言字幕。
  - {原名}_tmp.srt：这是翻译后、准备用于配音的 目标语言字幕。您遇到的情况是，这个文件在最终合并前的内容是完整的，但合并过程出了问题。
手动备份与处理：
- 在任务开始后，您可以随时进入这个临时目录，将 _tmp.srt 文件复制出来进行备份。
- 或者，在任务失败后，立即去该目录下查找这个 _tmp.srt 文件，它很可能包含了所有已成功翻译的字幕行。
使用独立功能进行后续处理：
- 获得完整的 _tmp.srt 文件后，您可以使用软件左侧的 “批量翻译SRT字幕” 或 “批量为字幕配音” 功能，直接加载这个字幕文件进行后续操作，从而绕过有问题的“最终合并”步骤。

为了从根本上解决这个问题，请同时检查您的Gemini翻译设置，确保在 高级选项 中已将 “同时翻译的字幕行数” 设为 1 并取消勾选 “发送完整字幕文本给AI”，这能最大程度保证AI返回格式的规范性。

如果问题持续发生，请提供 logs 目录下的日志文件，这能帮助定位合并环节的具体错误。

Floor #6 117.152* reply at 8 months ago

使用视频转录加翻译功能时不会出现这个现象，设置都一样，至少最终不会丢失大量翻译。但是单独使用批量转换字幕时就出现这个情形。

Floor #7 DeepSeek reply at 8 months ago

您观察到的现象非常关键，这清晰地表明问题出在“批量翻译SRT字幕”这个独立功能的最终文件合并逻辑上，而不是翻译模型本身。

既然“视频转录加翻译”流程正常，而“批量翻译SRT”会丢失数据，说明前者在处理翻译结果和生成最终SRT文件时的代码路径更健壮，后者可能存在一个在处理大批量行时的边界错误。

以下是您当前可以采取的解决方案：

利用“视频转录加翻译”功能作为替代方案（推荐）：
- 虽然您的目的是翻译字幕，但您可以利用主流程的稳定性。
- 操作步骤：
  - 在软件主界面，选择 “翻译视频和音频” 功能。
  - 在“源语言”和“目标语言”中，选择与您的SRT文件对应的语言（例如，源语言：中文，目标语言：英文）。
  - 关键一步： 在“语音识别渠道”下拉菜单中，选择 “已有字幕文件”，然后选择您要翻译的那个SRT文件。
  - 后续的翻译、配音等设置按您的需求配置或保持默认即可。
- 这样，软件会将您的SRT文件当作“识别结果”直接送入后面稳定可靠的翻译和字幕生成流程，从而绕过有问题的“批量翻译SRT”模块。
继续尝试定位并修复“批量翻译SRT”的问题：
- 提供日志文件： 要解决这个底层Bug，开发者需要看到错误发生时的具体日志。请提供一次失败操作后，logs/目录下对应的 .log 文件内容。日志中会记录合并阶段的具体错误信息。
- 简化测试： 您可以尝试将一个大的SRT文件拆分成几个小文件（比如前200行，后200行），分别用“批量翻译SRT”功能处理，看是否所有小文件都能成功，这有助于确认是否是文件行数触发的特定问题。

总结：
目前，最直接有效的办法是使用第一个替代方案。这能让您立即继续工作，同时保留了完整的翻译质量。要根治“批量翻译SRT”功能的问题，则需要您提供详细的日志供开发者分析。

请尝试第一种方法，它应该能完美解决您的问题。

Floor #8 117.152* reply at 8 months ago

我没有找到已有字幕文件这一步

Floor #9 DeepSeek reply at 8 months ago

您说得对，我的指引有误，在“翻译视频和音频”功能的“语音识别渠道”中并没有“已有字幕文件”这个选项。我为这个错误的指引道歉。

让我们回到正确的问题上：“批量翻译SRT字幕”功能在最终合并时丢失部分翻译。

既然“视频转录加翻译”流程是正常的，这强烈暗示“批量翻译SRT字幕”功能在处理和合并大批量翻译结果时存在一个特定的Bug。要解决这个问题，请按以下步骤操作：

提供关键日志文件
这是目前最重要的一步，没有日志开发者无法定位问题。请进行一次“批量翻译SRT字幕”操作，在出现翻译丢失后，立刻打开 软件根目录/logs/ 文件夹，找到最新的以日期命名的 .log 文件（例如 20241115.log）。
将整个文件的内容复制并提交给开发者。日志中会精确记录翻译API的每次请求和响应，以及合并阶段可能出现的错误或警告，这是修复Bug的关键。
一个可行的临时替代方案
虽然不能直接加载SRT，但您可以通过一个“迂回”的方法利用稳定的主流程：
- 使用任何视频编辑软件或格式转换工具（如FFmpeg），将您的SRT字幕文件“烧录”到一个任意的、短小的无声视频文件上（比如一个几秒钟的黑屏视频），生成一个带硬字幕的MP4文件。
- 然后，在pyVideoTrans主界面使用“翻译视频和音频”功能，处理这个新生成的MP4文件。
- 在“语音识别”步骤，软件会从视频中重新识别出您的字幕文本，然后进入后续稳定的翻译和字幕生成流程。
- 最后，您可以在输出文件夹中找到翻译好的新SRT文件。

这个方案虽然多了一步，但可以确保您获得一个完整、可靠的翻译结果。

总结：请优先尝试提供日志文件，这是根治问题的唯一途径。同时，您可以使用上述的临时方案来继续您的工作。

Floor #10 152.69* reply at 8 months ago

--- Application started at 2025-10-18 02:36:17 ---
最终确定使用的编码器: h264_nvenc
self.aisendsrt=True
content="# 角色\n你是一个顶级的SRT字幕翻译引擎，专门负责将SRT字幕精准地翻译成 {lang}。你的核心任务是生成专业、格式严谨的双语对照SRT字幕。\n\n# 核心任务\n处理标签内的原始SRT字幕，将其翻译成 {lang}，并严格按照下述规则和格式输出。\n\n# 工作流程与规则\n你必须严格遵循以下步骤和规则：\n\n1. **保留结构**: 完整保留原始SRT的序号、时间码（格式为 `00:00:00,000`）以及字幕条目之间的空行。绝不能修改或删除它们。\n\n2. **强制双语格式**: 每个字幕条目必须包含两行文本内容。\n - 第一行：原始字幕文本。\n - 第二行：对应的 {lang} 译文。\n\n3. **翻译风格**:\n - 译文必须通俗易懂、口语化。\n - 优先使用简洁的表达，避免不必要的长句。\n\n4. **特殊内容处理**:\n - **非翻译内容**: 如果某行字幕仅由数字、空格、标点符号或其任意组合构成（例如 `...` 或 `123-456`），则不要翻译。直接将原文复制为译文行，以满足“强制双语格式”规则。\n - **无法翻译的内容**: 如果遇到确实无法翻译的文本（如无意义的乱码或特定上下文的专有词），译文行必须是一个**空行**。绝不能输出任何解释、注释或错误信息。\n你必须严格遵循下列输出格式，请注意行号和时间戳在不同的行。严格遵循下面的输出示例\n# 输出格式\n所有最终结果，即完整的双语SRT内容，都必须被一个 XML 标签严格包裹。除此之外，不要有任何其他多余的文字或解释。\n\n\n# 输出示例\nxml\n\n1\n00:00:00,760 --> 00:00:01,256\n原文文本\n{lang}译文文本\n\n2\n00:00:01,816 --> 00:00:04,488\n原文文本\n{lang}译文文本\n\n\n请注意你经常发生把上个译文文本和下个行号放在同一行的错误，这并不符合我们的格式要求，我们要求时间戳前面的行号的在单独一行的，哪怕前面是逗号，也必须要遵守。这是必须要遵守的，请注意检查。\n你必须以最严格的方式遵守上述格式，这是不可违背的，必要要遵守的，你必要输出行号和时间戳在不同的行。上述例子你要严格遵守，每次输出内容之前自动检查是否遵守上述格式。\n\n下面是错误格式\n\n300\n00:12:09,750 --> 00:12:11,925\nNo, I mean, well, if you can do relative,\n不，我的意思是，如果你能做相对的，301\n\n00:12:11,925 --> 00:12:13,415\nthat's fine, although it turns out that giving,\n这没关系，尽管结果是给予，\n\n这个格式是不正确的，因为行号301和译文在同一行，正确格式如下，你要避免犯这个错误，否则会有非常严重的问题发生。\n\n300\n00:12:09,750 --> 00:12:11,925\nNo, I mean, well, if you can do relative,\n不，我的意思是，如果你能做相对的，\n\n301\n00:12:11,925 --> 00:12:13,415\nthat's fine, although it turns out that giving,\n这没关系，尽管结果是给予，\n\n# 输入规范\n现在，请处理下方 `` 标签内的原始SRT字幕内容。\n\n## 术语表\n严格按照以下术语表进行翻译,如果句子中出现术语,必须使用对应的翻译,而不能自由翻译：\n| 术语 | 翻译 |\n| --------- | ----- |\n|CEO|首席执行官|\n\n\n"
self.aisendsrt=True
content="# 角色\n你是一个顶级的SRT字幕翻译引擎，专门负责将SRT字幕精准地翻译成 {lang}。你的核心任务是生成专业、格式严谨的双语对照SRT字幕。\n\n# 核心任务\n处理标签内的原始SRT字幕，将其翻译成 {lang}，并严格按照下述规则和格式输出。\n\n# 工作流程与规则\n你必须严格遵循以下步骤和规则：\n\n1. **保留结构**: 完整保留原始SRT的序号、时间码（格式为 `00:00:00,000`）以及字幕条目之间的空行。绝不能修改或删除它们。\n\n2. **强制双语格式**: 每个字幕条目必须包含两行文本内容。\n - 第一行：原始字幕文本。\n - 第二行：对应的 {lang} 译文。\n\n3. **翻译风格**:\n - 译文必须通俗易懂、口语化。\n - 优先使用简洁的表达，避免不必要的长句。\n\n4. **特殊内容处理**:\n - **非翻译内容**: 如果某行字幕仅由数字、空格、标点符号或其任意组合构成（例如 `...` 或 `123-456`），则不要翻译。直接将原文复制为译文行，以满足“强制双语格式”规则。\n - **无法翻译的内容**: 如果遇到确实无法翻译的文本（如无意义的乱码或特定上下文的专有词），译文行必须是一个**空行**。绝不能输出任何解释、注释或错误信息。\n你必须严格遵循下列输出格式，请注意行号和时间戳在不同的行。严格遵循下面的输出示例\n# 输出格式\n所有最终结果，即完整的双语SRT内容，都必须被一个 XML 标签严格包裹。除此之外，不要有任何其他多余的文字或解释。\n\n\n# 输出示例\nxml\n\n1\n00:00:00,760 --> 00:00:01,256\n原文文本\n{lang}译文文本\n\n2\n00:00:01,816 --> 00:00:04,488\n原文文本\n{lang}译文文本\n\n\n请注意你经常发生把上个译文文本和下个行号放在同一行的错误，这并不符合我们的格式要求，我们要求时间戳前面的行号的在单独一行的，哪怕前面是逗号，也必须要遵守。这是必须要遵守的，请注意检查。\n你必须以最严格的方式遵守上述格式，这是不可违背的，必要要遵守的，你必要输出行号和时间戳在不同的行。上述例子你要严格遵守，每次输出内容之前自动检查是否遵守上述格式。\n\n下面是错误格式\n\n300\n00:12:09,750 --> 00:12:11,925\nNo, I mean, well, if you can do relative,\n不，我的意思是，如果你能做相对的，301\n\n00:12:11,925 --> 00:12:13,415\nthat's fine, although it turns out that giving,\n这没关系，尽管结果是给予，\n\n这个格式是不正确的，因为行号301和译文在同一行，正确格式如下，你要避免犯这个错误，否则会有非常严重的问题发生。\n\n300\n00:12:09,750 --> 00:12:11,925\nNo, I mean, well, if you can do relative,\n不，我的意思是，如果你能做相对的，\n\n301\n00:12:11,925 --> 00:12:13,415\nthat's fine, although it turns out that giving,\n这没关系，尽管结果是给予，\n\n# 输入规范\n现在，请处理下方 `` 标签内的原始SRT字幕内容。\n\n## 术语表\n严格按照以下术语表进行翻译,如果句子中出现术语,必须使用对应的翻译,而不能自由翻译：\n| 术语 | 翻译 |\n| --------- | ----- |\n|CEO|首席执行官|\n\n\n"
2025-10-18 02:49:39,327 - VideoTrans - ERROR - Connection error.
Traceback (most recent call last):
File "httpx\_transports\default.py", line 101, in map_httpcore_exceptions
File "httpx\_transports\default.py", line 250, in handle_request
File "httpcore\_sync\connection_pool.py", line 216, in handle_request
File "httpcore\_sync\connection_pool.py", line 196, in handle_request
File "httpcore\_sync\http_proxy.py", line 344, in handle_request
File "httpcore\_sync\http11.py", line 143, in handle_request
File "httpcore\_sync\http11.py", line 113, in handle_request
File "httpcore\_sync\http11.py", line 186, in _receive_response_headers
File "httpcore\_sync\http11.py", line 238, in _receive_event
httpcore.RemoteProtocolError: Server disconnected without sending a response.

The above exception was the direct cause of the following exception:

Traceback (most recent call last):
File "openai\_base_client.py", line 982, in request
File "httpx\_client.py", line 913, in send
File "httpx\_client.py", line 941, in _send_handling_auth
File "httpx\_client.py", line 978, in _send_handling_redirects
File "httpx\_client.py", line 1013, in _send_single_request
File "httpx\_transports\default.py", line 249, in handle_request
File "contextlib.py", line 153, in exit
File "httpx\_transports\default.py", line 118, in map_httpcore_exceptions
httpx.RemoteProtocolError: Server disconnected without sending a response.

The above exception was the direct cause of the following exception:

Traceback (most recent call last):
File "videotrans\task\job.py", line 146, in run
File "videotrans\task\_translate_srt.py", line 45, in trans
File "videotrans\translator\__init__.py", line 920, in run
File "videotrans\translator\_base.py", line 83, in run
File "tenacity\__init__.py", line 480, in call
File "videotrans\translator\_gemini.py", line 61, in _item_task
File "openai\_utils\_utils.py", line 286, in wrapper
File "openai\resources\chat\completions\completions.py", line 1147, in create
File "openai\_base_client.py", line 1259, in post
File "openai\_base_client.py", line 1014, in request
openai.APIConnectionError: Connection error.
self.aisendsrt=True

之后文件翻译丢失，在最后一步合并之前看这个界面的翻译还挺正常的，

缓存可以看到有翻译，能不能保留最后一步处理之前的，哪怕最后手动微调。

Floor #11 DeepSeek reply at 8 months ago

<RESULT>
感谢您提供详细的日志和截图。从日志中可以清晰地看到问题根源：Gemini API 连接中断 (httpx.RemoteProtocolError: Server disconnected without sending a response)。这导致翻译任务在某个批次失败，后续的字幕行没有被翻译，因此在最终合并时出现了大量翻译丢失。

您希望保留中间翻译结果的思路完全正确。软件确实会生成这些中间缓存文件，您可以按以下步骤手动找回并整合：

1. 立即找回已翻译的内容

在任务失败后，不要关闭软件，立即按以下路径操作：

进入您设置的 输出文件夹。
找到以您的任务名或时间戳命名的 临时工作目录。
在此目录内查找名为 {您的文件名}_tmp.srt 的文件。
立即复制备份这个文件。这个文件包含了所有在API中断之前已成功翻译的字幕行。

2. 定位并补全缺失部分

用文本编辑器打开您备份的 _tmp.srt 文件和原始的SRT文件进行对比。
找到翻译中断的起始位置（通常是某个序号之后的内容全部是原文）。
将 从中断位置开始到文件末尾 的原文字幕行单独保存为一个新的SRT文件。

3. 完成剩余翻译

使用软件的 “批量翻译SRT字幕” 功能，单独翻译您在步骤2中保存的那个“未翻译部分”的SRT文件。
在翻译前，请务必进入 菜单 -> 工具/选项 -> 高级选项，在“翻译”区域进行以下设置以增加稳定性：
- 将 “同时翻译的字幕行数” 设置为 1。
- 取消勾选 “发送完整字幕文本给AI”。
翻译完成后，您将得到两个文件：一个完整的“前半部分”和一个完整的“后半部分”。
手动将这两个SRT文件的内容合并成一个完整的双语SRT文件。

根本原因与预防

您遇到的 RemoteProtocolError 通常是网络波动或服务器过载导致的。为了预防：

调整请求频率：如上所述，在高级选项中设置“同时翻译的字幕行数”为 1，这能降低请求频率，减少被服务器中断的概率。
使用代理：如果您的网络环境不稳定，可以在软件的翻译设置中配置网络代理。

这个手动整合的方案虽然多了一步，但能确保您挽救几乎所有已完成的翻译工作，避免重复劳动。

#1050 srt翻译字幕处理失败

11 Replies

1. 立即找回已翻译的内容

2. 定位并补全缺失部分

3. 完成剩余翻译

根本原因与预防

Post Your Reply

Related resource