#358 翻译断句过长，全屏字幕问题

39.149* Posted at: 10 months ago

所有可能的设置都试过了，目前只有视频开头一分钟左右会有此问题，想不通

Floor #1 129.159* reply at 9 months ago

Admin

查看这个说明，按此设置 https://bbs.pyvideotrans.com/show/540

Floor #2 2408:8956* reply at 9 months ago

我的也是这样，有解决好的大哥吗，怎么弄啊

Floor #3 0.0* reply at 9 months ago

本条内容由 DeepSeek 回复

根据您提供的截图和描述，这个问题是典型的 语音识别结果不准确 导致的。视频开头一分钟左右识别出的字幕文本包含大量乱码和错误字符，这会直接导致后续的翻译和配音环节也出现问题。

核心解决方案：优化语音识别设置

请按照以下步骤调整您的语音识别参数，这能显著提升识别准确率：

1. 选择更准确的识别模型：

在“语音识别渠道”中，确保您使用的是 faster-whisper(本地) 或 openai-whisper(本地)。
在模型选择下拉菜单中，强烈建议选择 large-v2 或 large-v3 模型。避免使用 tiny, base 等小模型，它们的准确度很低。

2. 优化高级识别参数：

点击软件顶部菜单栏的 工具/选项 -> 高级选项。
在弹出的窗口中，找到并点击 “faster/openai语音识别调整”。
按照下图所示，将参数调整为推荐值，这能有效过滤噪音并改善断句：
语音阈值: 0.5
最短持续时间/毫秒: 0
最大语音持续时间/秒: 5
静音分隔毫秒: 140
语音填充: 0
点击“确定”保存设置。

3. 开启智能断句功能：

在主界面的“语音识别”区域，勾选 “LLM重新断句” 选项。这个功能会使用大语言模型对识别出的文字进行智能断句和标点优化，能极大提升字幕的可读性和准确性（此功能仅对 faster-whisper 和 openai-whisper 渠道有效）。

4. （可选）尝试降噪：

如果您的视频背景噪音较大，可以尝试勾选“降噪”选项。但请注意，此功能效果因视频而异，有时可能适得其反。

完成以上设置后，请重新处理您的视频。通常情况下，识别准确度会有明显改善。如果问题依旧存在，请提供软件目录 videotrans/logs/ 下的最新日志文件，以便进行更深入的分析。

Floor #4 191.6* reply at 7 months ago

eu uso o ASR channel: deepgram.com e esta gerando o texto muito grande

Floor #5 DeepSeek reply at 7 months ago

您遇到的问题是由于 Deepgram 语音识别返回的文本过长，且没有进行断句和标点分割，导致字幕行过长，影响后续处理和观看。

核心解决方案：启用本地智能断句功能。

请按以下步骤操作：

在主界面进行设置：
- 在“语音识别”区域，找到并勾选 “LLM重新断句” 选项。
- 确保其下方的“断句方式”选择为 “本地算法重断句” 或 “LLM大模型重断句”（如果已配置了 OpenAI/DeepSeek 等 API Key）。
（可选）调整断句参数（如果使用“本地算法重断句”）：
- 点击顶部菜单栏的 工具/选项 -> 高级选项。
- 在“通用设置”区域，找到 “LLM重新断句每批字词数”。
- 您可以尝试增大这个数值（例如从默认的 1000 调整为 2000），让断句算法一次性处理更多文本，以获得更好的上下文断句效果。

原理说明：
Deepgram 等在线 API 有时会返回一整段没有标点的长文本。pyVideoTrans 的“LLM重新断句”功能专门用于处理这种情况，它会将长文本根据语义和停顿，智能地分割成带有标点的短句，形成正常的字幕行。

设置完成后，请重新处理视频，字幕的格式应该会恢复正常。

Floor #6 191.6* reply at 7 months ago

não é possível usar o Resegmentação LLM , não tenho api , me informe outro metodo

Floor #7 DeepSeek reply at 7 months ago

您无法使用LLM重新断句，因为需要API。请改用以下方法：

使用本地算法断句：
- 在主界面的“语音识别”区域，将“断句方式”从“默认断句”改为 “本地算法重断句”。
- 这个功能完全本地运行，不需要任何API密钥，可以有效将Deepgram返回的长文本分割成合理的短句。
调整本地断句参数（可选，用于微调）：
- 点击顶部菜单栏的 工具/选项 -> 高级选项。
- 在“通用设置”区域，找到 “LLM重新断句每批字词数”。即使您使用“本地算法”，这个参数也有效。
- 您可以尝试增大这个数值（例如从默认的1000调整为2000或3000），让断句算法一次性分析更多文本，以获得更符合上下文的断句结果。

本地算法重断句是专门为解决此类问题而设计的功能，它不依赖外部API，应该能有效解决Deepgram返回文本过长、无标点的问题。

Floor #8 191.6* reply at 7 months ago

eu uso o ASR channel: deepgram.com e esta gerando o texto muito grande, corrija sem usar LLM

Floor #9 DeepSeek reply at 7 months ago

您的问题是 Deepgram 语音识别返回的文本过长且无断句。在不使用 LLM 的情况下，请按以下步骤解决：

启用本地算法断句：
在主界面的“语音识别”区域，将“断句方式”从“默认断句”改为 “本地算法重断句”。这是核心步骤，该功能完全本地运行，无需API，专门用于分割长文本。
（可选）微调断句参数：
如果断句效果仍不理想，可以调整参数：
- 点击顶部菜单栏的 工具/选项 -> 高级选项。
- 在“通用设置”区域，找到 “LLM重新断句每批字词数”。
- 尝试增大这个数值（例如从默认的 1000 调整为 2000 或 3000），让本地算法一次性分析更多上下文，以获得更合理的断句。
检查并调整识别模式：
确保您的“识别模式”选择的是 “整体识别” 而不是“批量推理”。“整体识别”模式使用VAD（语音活动检测）进行断句，通常比“批量推理”的断句效果更好。

完成以上设置后，请重新处理视频。本地算法重断句应该能将 Deepgram 返回的长文本正确分割成带标点的短句字幕。

Floor #10 191.6* reply at 7 months ago

400 Client Error: Bad Request for url: https://translate.google.com/m?sl=en&tl=pt&hl=pt&q=Hearing%20Mark%20confess%20his%20love%20to%20her,%20JJ%20was%20touched%20but%20soon%20realized%20that%20she%20didn't%20want%20to%20rush%20into%20it%20and%20wasn't%20sure%20if%20her%20feelings%20were%20mutual.%20Ignoring%20the%20guy%20and%20reducing%20the%20whole%20conversation%20to%20a%20joke,%20the%20girl%20runs%20away.%20A%20little%20later,%20she%20finds%20herself%20in%20the%20girl's%20restroom%20where%20she%20notices%20several%20writings%20left%20by%20other%20female%20students.%20Some%20of%20the%20writings%20frankly%20anger%20JJ,%20especially%20the%20mention%20of%20Mark%20who%20is%20the%20dream%20of%20many%20girls.%20Deciding%20to%20use%20the%20so%20called%20message%20board,%20JJ%20writes%20a%20few%20words%20and%20leaves,%20leaving%20her%20cell%20phone%20in%20the%20bathroom.%20A%20little%20later,%20she%20shows%20Sima%20and%20David%20the%20videotape%20made%20in%20the%20restroom.%20Immediately%20
......
er.%20Felix%20notices%20that%20Eris%20and%20his%20cousin%20have%20a%20tainted%20relationship.%20He%20assumes%20that%20Mark's%20revenge%20plan%20doesn't%20make%20sense,%20but%20soon%20realizes%20that%20the%20guy%20just%20has%20a%20thing%20for%20JJ%20and%20his%20plans%20have%20been%20out%20of%20control%20for%20a%20long%20time.%20Meanwhile,%20Kiko%20approaches%20JJ%20and%20confesses%20his%20sympathy%20for%20her.%20The%20guy%20from%20the%20elite%20class%20asks%20for%20permission%20to%20court%20the%20girl,%20but%20she%20is%20shocked%20and%20doesn't%20know%20what%20to%20say%20in%20response.%20David%20overhears%20the%20conversation%20and%20prevents%20them%20from%20communicating.%0AForcefully%20taking%20the%20girl%20to%20the%20kitchen,%20David%20tells%20his%20classmates%20about%20everything.%0AYuri,%20Mark,%20and%20other%20guys%20who%20appreciate%20JJ%20are%20angry%20about%20what%20is%20happening%20and%20demand%20to%20answer%20if%20she%20had%20something%20with%20Kiko.%20The%20girl%20denies%20everything%20and%20promises%20not%20to%20give%20the%20guy%20a%20chance.%20Sam%20realizes%20that%20JJ%20is%20not%20interested%20in%20Kiko%20as%20she%20has%20an%20interest%20in%20one%20of%20her%20classmates.%20At%20the%20same%20time,%20he%20asked%20the%20girl%20to%20stay%20away%20from%20Kiko%20because%20he%20is%20a%20bully%20who%20has%20repeatedly%20beaten%20David%20and%20in%20a%20foul%20fight.%20In%20the%20evening,%20Yuri%20gives%20JJ%20a%20ride%20home%20as%20she%20is%20suddenly%20met%20by%20Kiko.%20He%20asks%20her%20to%20think%20about%20his%20proposal%20but%20Eris%20interferes%20with%20communication.%0AHe%20forbids%20his%20sister%20from%20seeing%20anyone%20reminding%20her%20that%20her%20ex%20is%20still%20in%20a%20coma%20in%20the%20hospital.%20The%20next%20morning,%20JJ%20is%20greeted%20by%20Mark%20who%20has%20been%20waiting%20outside%20her%20house%20since%20the%20morning.%20Asked%20to%20feed%20him,%20the%20guy%20eats%20from%20the%20girl's%20hands%20and%20she%20finds%20it%20very%20romantic.%20A%20couple%20weeks%20later,%20Aman%20informs%20her%20that%20his%20father%20has%20recovered%20and%20the%20cooks%20are%20going%20back%20to%20work.%20So%20his%20classmates%20may%20not%20help%20him%20anymore.%20As%20a%20thank%20you,%20not%20only%20does%20he%20return%20to%20class,%20but%20he%20will%20cook%20a%20holiday%20meal%20for%20them.%20Realizing%20that%20they%20are%20unlikely%20to%20be%20at%20the%20restaurant%20again,%20Mark%20orders%20breakfast%20for%20two%20for%20himself%20and%20JJ.%20At%20first,%20he%20jokes%20that%20the%20girl%20will%20be%20paying,%20but%20soon%20informs%20her%20that%20it's%20a%20prank.%20Yuri%20watches%20them%20and%20remains%20jealous%20of%20JJ,%20but%20is%20afraid%20to%20admit%20his%20feelings.%20A%20couple%20days%20later,%20the%20classmates%20arrive%20at%20JJ's%20house%20and%20suggest%20they%20go%20shopping.%20They%20go%20to%20the%20supermarket%20and%20buy%20a%20lot%20of%20food%20so%20they%20can%20cook%20at%20school%20and%20do%20without%20the%20cafeteria.

Floor #11 DeepSeek reply at 7 months ago

您遇到的“400 Client Error: Bad Request”错误，是由于发送给Google翻译的文本过长，超过了其单次请求的URL长度限制。这是Google翻译渠道的一个已知限制。

核心解决方案：减少单次发送的文本量

请按以下步骤操作：

调整翻译批处理设置：
- 点击软件顶部菜单栏的 工具/选项 -> 高级选项。
- 在“字幕翻译调整”区域，找到 “每批字幕行数”。
- 将默认值（例如10或20）大幅调小，建议先尝试设置为 1 或 2。
- 点击“确定”保存。
（可选）启用“发送完整字幕”：
- 在同一个“字幕翻译调整”区域，勾选 “发送完整字幕” 选项。
- 此选项会为每行字幕附加上下文，虽然可能增加单次请求的数据量，但有时能避免因纯机械分割导致的语义错误。如果开启后问题重现，请关闭它。

原理说明：
当“每批字幕行数”设置过大时，软件会将多行字幕合并成一个很长的句子发送给Google翻译。这个长句被编码到URL中，导致URL长度超出Google服务器的接受范围，从而触发400错误。调小批处理行数，确保每次请求的文本足够短，是解决此问题的直接方法。

设置完成后，请重新翻译。错误应该会消失。

Floor #12 191.6* reply at 7 months ago

Número de Linhas de Legenda por Lote não encontrado

Floor #13 DeepSeek reply at 7 months ago

您找不到“每批字幕行数”这个选项，可能是因为界面语言或版本差异。请按以下步骤找到并调整该设置：

点击软件顶部菜单栏的 工具/选项 -> 高级选项。
在弹出的“高级选项”窗口中，找到名为 “字幕翻译调整” 的区域。
在该区域内，寻找一个控制翻译并发量的数字输入框。它的名称可能是 “每批字幕行数”、“同时翻译字幕数” 或类似的表述。
将它的数值从默认值（如10或20）大幅调小，建议先设置为 1 或 2。
点击“确定”保存设置。

这个设置的作用是限制每次发送给Google翻译的文本量。数值调小后，可以避免因单次请求文本过长导致的“400 Bad Request”错误。

设置完成后，请重新尝试翻译。

Floor #14 191.6* reply at 7 months ago

é alguma dessas opçoes?

Floor #15 DeepSeek reply at 7 months ago

是的，您圈出的正是相关设置。请按以下步骤操作来解决“400 Bad Request”错误：

在“字幕翻译调整”区域，找到 “同时翻译字幕数”。
将其数值从默认的 10 或 20 大幅调小。建议先设置为 1。
点击“确定”保存设置。

原理说明：这个设置控制每次发送给Google翻译的字幕行数。当数值过大时，合并后的文本会很长，编码到URL中会超出Google服务器的接受限制，从而触发400错误。将其设为 1 可以确保每次请求的文本最短，从而避免此错误。

设置完成后，请重新进行翻译操作，错误应该会消失。

Floor #16 191.6* reply at 7 months ago

qual dessa é?

Floor #17 DeepSeek reply at 7 months ago

是的，您圈出的正是关键设置。请按以下步骤操作：

在“字幕翻译调整”区域，找到 “同时翻译字幕数”。
将其数值从默认的 10 或 20 调小。为了解决“400 Bad Request”错误，建议先将其设置为 1。
点击“确定”保存设置。

原理说明：这个设置控制每次发送给Google翻译的字幕行数。当数值过大时，软件会将多行字幕合并成一个很长的句子，导致生成的URL过长，超出了Google翻译服务器的接受限制，从而触发“400 Bad Request”错误。将其设为 1 可以确保每次请求的文本最短，从而避免此错误。

设置完成后，请重新进行翻译操作，错误应该会消失。

Floor #18 240e:36a* reply at 6 months ago

翻译视频校对时，怎么让字幕换行

Floor #19 DeepSeek reply at 6 months ago

在pyVideoTrans中，校对字幕时让字幕换行的方法如下：在字幕编辑器中，当您需要换行时，只需在想要换行的位置按 Enter（回车）键 即可。软件会自动将光标后的文本移动到下一行，并在保存后，视频中的字幕也会按照这个换行显示。操作步骤：在翻译流程中，当语音识别完成后，软件会弹出“字幕编辑”窗口。在此窗口中，找到您需要编辑的字幕行。将光标移动到您希望换行的位置。按下键盘上的 Enter（回车）键。您会看到文本被分成两行。点击“保存”或“确定”继续后续流程。最终生成的视频字幕就会按照您设置的换行来显示。这是控制字幕分行显示最直接有效的方法。

Floor #20 240e:36a* reply at 6 months ago

画面一般一行多少个字时不会超出画面，或都一行多少个字时最佳。

Floor #21 DeepSeek reply at 6 months ago

在视频字幕制作中，为了确保字幕清晰易读且不超出画面，遵循以下行业通用规范是最佳实践：单行字数限制：建议每行字幕最多不超过 15 个中文字符（或英文单词 5-7 个）。这是保证在标准宽高比（16:9）视频中，字幕能完整显示且不影响观看体验的安全范围。最佳显示行数：同时显示在屏幕上的字幕，最好不超过 2 行。单行字幕的视觉效果最佳。在pyVideoTrans中应用：当您在字幕编辑器中手动换行时，请以上述标准（单行 ≤ 15 字）作为参考。软件本身不会自动限制字数，因此需要您根据内容语义和字数手动按 Enter 键换行。例如，如果一行识别/翻译出的字幕有25个字，您应该在接近第12-15个字的位置（同时考虑语句的停顿和语义完整性）按下回车键，将其分为两行显示。遵循这个规范可以确保您的字幕在任何设备上都能清晰、完整地显示。

Floor #22 240e:36a* reply at 6 months ago

字幕编辑器中手动回车换行时，没反应？

#358 翻译断句过长，全屏字幕问题

22 Replies

Post Your Reply

Related resource