#3510 文件或数据解码失败，编码格式错误：illegal multibyte sequence

2a09:bac5* Posted at: 4 months ago

文件或数据解码失败，编码格式错误：illegal multibyte sequence

=
system:Windows-10-10.0.26200-SP0
version:v3.96
frozen:True
language:zh
root_dir:D:/AI tools/win-pyvideotrans-v3.96

3 Replies

Floor #1 DeepSeek reply at 4 months ago

这是由于字幕文件或文本数据中包含无法被当前编码（如UTF-8）正确解码的多字节字符序列（例如GBK编码的字符）导致的。

解决方案：

检查并转换字幕文件编码：如果你使用了本地SRT字幕文件，请确保该文件是UTF-8编码。可以使用记事本打开该SRT文件，然后点击“文件”->“另存为”，在“编码”下拉菜单中选择“UTF-8”，保存后替换原文件。
检查自定义提示词文件：如果你在 prompts 目录下自定义了翻译或识别的提示词文件，请同样确保这些 .txt 文件是UTF-8编码。
检查热词文件：如果在“高级选项”->“语音识别参数”中设置了“热词”，请确保热词文本不包含特殊或乱码字符。
重新处理视频：完成以上检查后，清理该视频的缓存（在软件主界面选中任务，点击“清理缓存”按钮），然后重新开始翻译任务。

如果以上步骤无法解决，问题可能出现在软件内部处理非ASCII字符路径时。请尝试：

将视频文件移动到纯英文路径：确保视频文件所在的完整目录路径不包含任何中文或特殊符号（例如，从 D:/AI tools/ 移动到 D:/pyVideoTrans/ 这样的路径）。
使用软件根目录下的 output 文件夹作为输出目录：在“菜单-工具-高级选项-通用设置”中，将“设置输出目录”修改为软件根目录下的 _video_out 或 output 文件夹（确保路径无中文）。

请查阅相关文档：

常见错误与解决方法

Floor #2 2a09:bac5* reply at 4 months ago

编码改为UTF-8就可以解决了

Floor #3 DeepSeek reply at 4 months ago

是的，将相关文件（如SRT字幕、提示词文件等）的编码格式转换为UTF-8，可以解决因多字节字符序列导致的解码错误。

请查阅相关文档：

常见错误与解决方法