python 利用panadas 进行分类+区分

陈公子的话 · 发表于 2020-12-17 21:10:59

import numpy as np
import pandas as pd
from pandas import Series, DataFrame

#随机种子
np.random.seed(666)

#25~100 取20个随机数 作为成绩
score_list = np.random.randint(25,100,size=20)
#print(score_list)

#指定多个区间  即不及格 及格  良好 优秀
bins= [0,59,70,80,100]

#每个成绩对应哪个区间
score_cut = pd.cut(score_list,bins=bins)
#print(score_cut)

#统计每个区间的人数
#print(pd.value_counts(score_cut))

df = DataFrame()
df['Students'] = [pd.util.testing.rands(3) for i  in range(len(score_list))]
df['Score'] =score_list
#print(df)

#使用cut 分别判断学生成绩 所在的区间
#print(pd.cut(df['Score'],bins=bins))

#将类别加入到我们的 DataFrame表格中去
#df ['Categories'] =pd.cut(df['Score'],bins=bins)

#这样打印出来的类型 Categories 是我们设置 的区间 0,59  59,70 70,80  80,100 等等  不方便阅读
#print(df)

#我们将这些类别重命名 方便区分和阅读
df['Categories'] = pd.cut(df['Score'],bins=bins,labels=['low', 'middle', 'good', 'perfect'])

#分开写法
#labels=['low', 'middle', 'good', 'perfect']
#df['Categories'] = pd.cut(df['Score'], bins,labels=labels )

print(df)

本来再写其他的，很多库没学过..写个例程熟悉一下