上一主题 下一主题
ScriptCat,新一代的脚本管理器脚本站,与全世界分享你的用户脚本油猴脚本开发指南教程目录
返回列表 发新帖
楼主: 言小溪enncy - 

关于超星最近题目乱码繁体字的解决方案

[复制链接]

该用户从未签到

5

主题

104

回帖

265

积分

荣誉开发者

积分
265

荣誉开发者生态建设者喜迎中秋

发表于 2022-4-27 10:17:32 | 显示全部楼层
王一之 发表于 2022-4-27 10:15
这个ocr效果好像不是很好,查题命中率大大降低

看上面的代码例子吧,错了一个字,其他都识别出来了。
编程真的会上瘾
回复
订阅

使用道具 举报

该用户从未签到

5

主题

104

回帖

265

积分

荣誉开发者

积分
265

荣誉开发者生态建设者喜迎中秋

发表于 2022-4-27 10:18:08 | 显示全部楼层
王一之 发表于 2022-4-27 10:15
这个ocr效果好像不是很好,查题命中率大大降低

只能说这个是下下策,有其他方法自然更好 🤣
编程真的会上瘾
回复

使用道具 举报

  • TA的每日心情
    开心
    前天 17:45
  • 签到天数: 878 天

    [LV.10]以坛为家III

    30

    主题

    732

    回帖

    7355

    积分

    荣誉开发者

    精通各种语言的HelloWord!

    积分
    7355

    荣誉开发者油中2周年生态建设者油中3周年挑战者 lv2

    发表于 2022-4-27 10:20:15 | 显示全部楼层
    接入百度orc响应速度和准确率会不会高点?或者雇佣女大学生来做字体映射
    回复

    使用道具 举报

  • TA的每日心情
    开心
    前天 17:45
  • 签到天数: 878 天

    [LV.10]以坛为家III

    30

    主题

    732

    回帖

    7355

    积分

    荣誉开发者

    精通各种语言的HelloWord!

    积分
    7355

    荣誉开发者油中2周年生态建设者油中3周年挑战者 lv2

    发表于 2022-4-27 10:22:58 | 显示全部楼层
    目前来看,orc算是最快解决办法了,期待大佬给出更牛逼的方案
    回复

    使用道具 举报

  • TA的每日心情
    开心
    3 小时前
  • 签到天数: 213 天

    [LV.7]常住居民III

    305

    主题

    4188

    回帖

    4055

    积分

    管理员

    积分
    4055

    管理员荣誉开发者油中2周年生态建设者喜迎中秋油中3周年挑战者 lv2

    发表于 2022-4-27 10:31:36 | 显示全部楼层
    还没遇到过,好像有的账号还没有加密

    复制粘贴的话,会不会复制出来的也是乱码啊?
    上不慕古,下不肖俗。为疏为懒,不敢为狂。为拙为愚,不敢为恶。
    回复

    使用道具 举报

    该用户从未签到

    5

    主题

    104

    回帖

    265

    积分

    荣誉开发者

    积分
    265

    荣誉开发者生态建设者喜迎中秋

    发表于 2022-4-27 10:34:42 | 显示全部楼层
    王一之 发表于 2022-4-27 10:31
    还没遇到过,好像有的账号还没有加密

    复制粘贴的话,会不会复制出来的也是乱码啊? ...

    估计是某些操作导致cx识别出来刷课行为。我也不太懂 🤣

    你用 py 或者 node 请求一下就知道了,源文件的字体是已经加密了的,加了 @font-facee 字体样式才能显示成正常字体,要不然看到的也是乱码。
    编程真的会上瘾
    回复

    使用道具 举报

  • TA的每日心情
    开心
    3 小时前
  • 签到天数: 213 天

    [LV.7]常住居民III

    305

    主题

    4188

    回帖

    4055

    积分

    管理员

    积分
    4055

    管理员荣誉开发者油中2周年生态建设者喜迎中秋油中3周年挑战者 lv2

    发表于 2022-4-27 10:53:14 | 显示全部楼层

    enncy 发表于 2022-4-27 10:34
    估计是某些操作导致cx识别出来刷课行为。我也不太懂 🤣
    你用 py 或者 node 请求一下就知道了,源文件的 ...[/quote]

    解析文件看了一下,可以只OCR他转化了的字,然后替换,不用处理全部的,应该能提高一些准确率

    B6FE9EC6222215D85927442F41D30EEC.jpg

    上不慕古,下不肖俗。为疏为懒,不敢为狂。为拙为愚,不敢为恶。
    回复

    使用道具 举报

    该用户从未签到

    5

    主题

    104

    回帖

    265

    积分

    荣誉开发者

    积分
    265

    荣誉开发者生态建设者喜迎中秋

    发表于 2022-4-27 11:08:13 | 显示全部楼层
    王一之 发表于 2022-4-27 10:53
    [md]> enncy 发表于 2022-4-27 10:34
    > 估计是某些操作导致cx识别出来刷课行为。我也不太懂 🤣
    > 你用 py  ...

    没必要,刚刚试了一下,加字体间隔和字体大小后基本正确率100% 😍
    编程真的会上瘾
    回复

    使用道具 举报

  • TA的每日心情
    开心
    2022-10-5 20:27
  • 签到天数: 2 天

    [LV.1]初来乍到

    0

    主题

    4

    回帖

    6

    积分

    助理工程师

    积分
    6
    发表于 2022-4-27 12:24:06 | 显示全部楼层
    兄弟,能讲一下具体怎么操作吗,不太会
    回复

    使用道具 举报

    该用户从未签到

    5

    主题

    104

    回帖

    265

    积分

    荣誉开发者

    积分
    265

    荣誉开发者生态建设者喜迎中秋

    发表于 2022-4-27 12:36:46 | 显示全部楼层
    smdssz 发表于 2022-4-27 12:24
    兄弟,能讲一下具体怎么操作吗,不太会

    看我写的例子啊,就是引入那2个依赖,然后代码直接复制粘贴就行了,或者等我开发完成后,开放一个API给你们调用
    编程真的会上瘾
    回复

    使用道具 举报

    发表回复

    本版积分规则

    快速回复 返回顶部 返回列表