李恒道 发表于 2025-1-25 18:55:26

一次乱码字体编码的破案之旅

乱码文件
```
0:00:13,750 --> 00:00:14,480
vQ諲剉篘 

8
00:00:15,130 --> 00:00:16,520
龕檣k哊 0

9
00:00:17,930 --> 00:00:20,740
購te*N NLu龕緰錘骮a屫? O g購7h剉踰鎮 
```
这种通常可以根据常用编码的暴力穷举来测试
www.blurredcode.com/2022/04/7210c1a5/
我们随便掏一个工具跑一下,选择乱码较少的部分,龕檣k哊

可以发现存在正确的字符
```
gbk encoding utf-16le decoding
b'\xfd\x90\x7f\x99{k\x86N'
都饿死了
```
接下来动手实践一下,找一个utf-16le的编码网站
www.browserling.com/tools/utf16-encode
都饿死了编码得到\u{90fd}\u{997f}\u{6b7b}\u{4e86}

然后颠倒大小端,得到了fd907f997b6b864e

在一个解码网站进行测试
https://r12a.github.io/app-encodings/
发现成功编码出来了乱码字体龕檣k哊
!(data/attachment/forum/202501/25/185519s7eu5ek58u0kckm1.webp)
说明是将utf16-le错误编码成了gbk/gb18030编码

修改编码即可实现乱码恢复正常文字

hysaoh 发表于 2025-1-28 10:07:53

哥哥真是天才
页: [1]
查看完整版本: 一次乱码字体编码的破案之旅