上一主题 下一主题
ScriptCat,新一代的脚本管理器脚本站,与全世界分享你的用户脚本油猴脚本开发指南教程目录
返回列表 发新帖

【opencv练习】青果课程表文字提取(一)

[复制链接]
  • TA的每日心情
    无聊
    2025-1-31 20:04
  • 签到天数: 195 天

    [LV.7]常住居民III

    745

    主题

    6520

    回帖

    7193

    积分

    管理员

    非物质文化遗产社会摇传承人

    积分
    7193

    荣誉开发者喜迎中秋油中2周年生态建设者

    发表于 2024-12-8 22:03:25 | 显示全部楼层 | 阅读模式

    突然想到以前上学的时候小米课程表还在正常维护
    当时官方提供了一个青果课程的文字识别
    觉得特别厉害
    慕然回首,小米课程表已经成为了一个废弃项目
    就尝试着从头实现一次青果课程表的提取作为纪念吧
    但是不确定会不会成功
    原图
    image.png

    胡椒噪点的处理

    一开始尝试二值化后用中值滤波发现文字也会被模糊掉
    经过多种的滤波尝试
    最后发现fastNlMeansDenoising(非局部平均去噪)的效果不错

    import cv2
    import numpy as np
    originImage = cv2.imread("test.png")        
    image = cv2.cvtColor(originImage, cv2.COLOR_BGR2GRAY)
    denoised_image = cv2.fastNlMeansDenoising(image, None, 30, 7, 21)

    image.png
    文字还算清晰,但是后边还是有胡椒噪点导致的斑斑点点,尝试用二值化去一下

    ret, thresh = cv2.threshold(denoised_image, 220, 255, cv2.THRESH_TRUNC)

    这个时候就基本干净了
    image.png
    然后获取一下轮廓线做边缘监测

    _, binary = cv2.threshold(thresh, 128, 255, cv2.THRESH_BINARY_INV)
    edges = cv2.Canny(binary, 50, 150)
    contours, _ = cv2.findContours(edges, cv2.RETR_TREE, cv2.CHAIN_APPROX_SIMPLE)

    最后将所有的框画出来看你看

    cv2.drawContours(originImage, contours, -1, (0,0, 255), 2)

    看效果来说还可以,下一步画框对框内文字检测ocr
    image.png
    但是一旦尝试过滤就会发现有一部分框是没有被识别到的,这部分还没有解决
    image.png

    待续

    loading....

    混的人。
    ------------------------------------------
    進撃!永遠の帝国の破壊虎---李恒道

    入驻了爱发电https://afdian.com/a/lihengdao666
  • TA的每日心情
    开心
    2024-11-21 13:37
  • 签到天数: 213 天

    [LV.7]常住居民III

    309

    主题

    4362

    回帖

    4212

    积分

    管理员

    积分
    4212

    管理员荣誉开发者油中2周年生态建设者喜迎中秋油中3周年挑战者 lv2

    发表于 2024-12-8 22:32:54 | 显示全部楼层
    ggnb 技术面越来越广了
    上不慕古,下不肖俗。为疏为懒,不敢为狂。为拙为愚,不敢为恶。
    回复

    使用道具 举报

  • TA的每日心情
    无聊
    2025-1-31 20:04
  • 签到天数: 195 天

    [LV.7]常住居民III

    745

    主题

    6520

    回帖

    7193

    积分

    管理员

    非物质文化遗产社会摇传承人

    积分
    7193

    荣誉开发者喜迎中秋油中2周年生态建设者

    发表于 2024-12-8 22:45:18 | 显示全部楼层
    王一之 发表于 2024-12-8 22:32
    ggnb 技术面越来越广了

    前端好像差不多了都喜欢往图形或者3d上折腾....
    好像对前端这方面入门更低一些
    不过现在想想以前确实没想过会玩一下这些
    混的人。
    ------------------------------------------
    進撃!永遠の帝国の破壊虎---李恒道

    入驻了爱发电https://afdian.com/a/lihengdao666
    回复

    使用道具 举报

    发表回复

    本版积分规则

    快速回复 返回顶部 返回列表