上一主题 下一主题
ScriptCat,新一代的脚本管理器脚本站,与全世界分享你的用户脚本油猴脚本开发指南教程目录
返回列表 发新帖

python 利用panadas 进行分类+区分

[复制链接]
  • TA的每日心情
    奋斗
    3 天前
  • 签到天数: 96 天

    [LV.6]常住居民II

    143

    主题

    525

    帖子

    848

    积分

    版主

    Rank: 8Rank: 8

    积分
    848

    猫咪币纪念章三好学生活跃会员热心会员突出贡献中秋纪念章国庆纪念章宣传达人推广达人

    发表于 2020-12-17 21:10:59 | 显示全部楼层 | 阅读模式
    import numpy as np
    import pandas as pd
    from pandas import Series, DataFrame
    
    #随机种子
    np.random.seed(666)
    
    #25~100 取20个随机数 作为成绩
    score_list = np.random.randint(25,100,size=20)
    #print(score_list)
    
    #指定多个区间  即不及格 及格  良好 优秀
    bins= [0,59,70,80,100]
    
    #每个成绩对应哪个区间
    score_cut = pd.cut(score_list,bins=bins)
    #print(score_cut)
    
    #统计每个区间的人数
    #print(pd.value_counts(score_cut))
    
    df = DataFrame()
    df['Students'] = [pd.util.testing.rands(3) for i  in range(len(score_list))]
    df['Score'] =score_list
    #print(df)
    
    #使用cut 分别判断学生成绩 所在的区间
    #print(pd.cut(df['Score'],bins=bins))
    
    #将类别加入到我们的 DataFrame表格中去
    #df ['Categories'] =pd.cut(df['Score'],bins=bins)
    
    #这样打印出来的类型 Categories 是我们设置 的区间 0,59  59,70 70,80  80,100 等等  不方便阅读
    #print(df)
    
    #我们将这些类别重命名 方便区分和阅读
    df['Categories'] = pd.cut(df['Score'],bins=bins,labels=['low', 'middle', 'good', 'perfect'])
    
    #分开写法
    #labels=['low', 'middle', 'good', 'perfect']
    #df['Categories'] = pd.cut(df['Score'], bins,labels=labels )
    
    print(df)

    本来再写其他的,很多库没学过..写个例程熟悉一下

    bilibili:陈公子的话   公众号:陈公子的话
  • TA的每日心情
    奋斗
    3 天前
  • 签到天数: 96 天

    [LV.6]常住居民II

    143

    主题

    525

    帖子

    848

    积分

    版主

    Rank: 8Rank: 8

    积分
    848

    猫咪币纪念章三好学生活跃会员热心会员突出贡献中秋纪念章国庆纪念章宣传达人推广达人

    发表于 2020-12-17 21:12:07 | 显示全部楼层
    哥哥为啥这代码贴出来 好丑 我很失望阿
    bilibili:陈公子的话   公众号:陈公子的话
    回复

    使用道具 举报

  • TA的每日心情
    慵懒
    昨天 00:09
  • 签到天数: 67 天

    [LV.6]常住居民II

    150

    主题

    2001

    帖子

    2133

    积分

    管理员

    Rank: 10Rank: 10Rank: 10

    积分
    2133

    猫咪币纪念章热心会员活跃会员突出贡献三好学生中秋纪念章国庆纪念章管理员家财万贯

    发表于 2020-12-18 14:49:11 | 显示全部楼层
    小陈 发表于 2020-12-17 21:12
    哥哥为啥这代码贴出来 好丑 我很失望阿

    过段时间应该就好了.....markdown的插件有bug,作者又不积极修...
    上不慕古,下不肖俗。为疏为懒,不敢为狂。为拙为愚,不敢为恶。/ 微信公众号:一之哥哥
    回复

    使用道具 举报

    发表回复

    本版积分规则

    快速回复 返回顶部 返回列表