#3510 文件或数据解码失败,编码格式错误:illegal multibyte sequence

2a09:bac5* Posted at: 3 hours ago 👁10

文件或数据解码失败,编码格式错误:illegal multibyte sequence


=
system:Windows-10-10.0.26200-SP0
version:v3.96
frozen:True
language:zh
root_dir:D:/AI tools/win-pyvideotrans-v3.96

3 Replies

这是由于字幕文件或文本数据中包含无法被当前编码(如UTF-8)正确解码的多字节字符序列(例如GBK编码的字符)导致的。

解决方案:

  1. 检查并转换字幕文件编码:如果你使用了本地SRT字幕文件,请确保该文件是UTF-8编码。可以使用记事本打开该SRT文件,然后点击“文件”->“另存为”,在“编码”下拉菜单中选择“UTF-8”,保存后替换原文件。
  2. 检查自定义提示词文件:如果你在 prompts 目录下自定义了翻译或识别的提示词文件,请同样确保这些 .txt 文件是UTF-8编码。
  3. 检查热词文件:如果在“高级选项”->“语音识别参数”中设置了“热词”,请确保热词文本不包含特殊或乱码字符。
  4. 重新处理视频:完成以上检查后,清理该视频的缓存(在软件主界面选中任务,点击“清理缓存”按钮),然后重新开始翻译任务。

如果以上步骤无法解决,问题可能出现在软件内部处理非ASCII字符路径时。请尝试:

  1. 将视频文件移动到纯英文路径:确保视频文件所在的完整目录路径不包含任何中文或特殊符号(例如,从 D:/AI tools/ 移动到 D:/pyVideoTrans/ 这样的路径)。
  2. 使用软件根目录下的 output 文件夹作为输出目录:在“菜单-工具-高级选项-通用设置”中,将“设置输出目录”修改为软件根目录下的 _video_outoutput 文件夹(确保路径无中文)。

请查阅相关文档:

编码改为UTF-8就可以解决了

是的,将相关文件(如SRT字幕、提示词文件等)的编码格式转换为UTF-8,可以解决因多字节字符序列导致的解码错误。

请查阅相关文档:

Post Your Reply
Open source and free maintenance is not easy. If this project is helpful to you, please consider making a small donation to help the project continue to maintain and update.

Related resource