上一主题 下一主题
ScriptCat,新一代的脚本管理器脚本站,与全世界分享你的用户脚本油猴脚本开发指南教程目录
返回列表 发新帖

一次乱码字体编码的破案之旅

[复制链接]
  • TA的每日心情
    擦汗
    2024-12-18 11:32
  • 签到天数: 194 天

    [LV.7]常住居民III

    740

    主题

    6301

    回帖

    7044

    积分

    管理员

    非物质文化遗产社会摇传承人

    积分
    7044

    荣誉开发者喜迎中秋油中2周年生态建设者

    发表于 5 天前 | 显示全部楼层 | 阅读模式

    乱码文件

    0:00:13,750 --> 00:00:14,480
    vQ諲剉篘 
    
    8
    00:00:15,130 --> 00:00:16,520
    龕檣k哊 0
    
    9
    00:00:17,930 --> 00:00:20,740
    購te*N NLu龕緰錘骮a屫? O g購7h剉踰鎮 

    这种通常可以根据常用编码的暴力穷举来测试
    www.blurredcode.com/2022/04/7210c1a5/
    我们随便掏一个工具跑一下,选择乱码较少的部分,龕檣k哊

    可以发现存在正确的字符

    gbk encoding utf-16le decoding
    b'\xfd\x90\x7f\x99{k\x86N'
    都饿死了

    接下来动手实践一下,找一个utf-16le的编码网站
    www.browserling.com/tools/utf16-encode
    都饿死了编码得到\u{90fd}\u{997f}\u{6b7b}\u{4e86}

    然后颠倒大小端,得到了fd907f997b6b864e

    在一个解码网站进行测试
    https://r12a.github.io/app-encodings/
    发现成功编码出来了乱码字体龕檣k哊
    v2-58fdb3fa562cb1390ea389afa31ae34a_720w.webp
    说明是将utf16-le错误编码成了gbk/gb18030编码

    修改编码即可实现乱码恢复正常文字

    混的人。
    ------------------------------------------
    進撃!永遠の帝国の破壊虎---李恒道

    入驻了爱发电https://afdian.com/a/lihengdao666
  • TA的每日心情
    开心
    2024-2-28 14:15
  • 签到天数: 4 天

    [LV.2]偶尔看看I

    37

    主题

    239

    回帖

    370

    积分

    版主

    积分
    370

    油中2周年生态建设者

    发表于 前天 10:07 | 显示全部楼层
    哥哥真是天才
    一叶叶,一声声,空阶滴到明。
    回复

    使用道具 举报

    发表回复

    本版积分规则

    快速回复 返回顶部 返回列表