:Python pandas库159个常用方法使用说明( 二 )


33、df.columns=[‘大写’,’小写’,’中文’] 为无索引表添加列索引
34、df.index=[1,2,3] 添加行索引
35、df.set_index(‘编号’) 指明要用的列作为行索列
36、df.rename(index={‘订单编号’:’新订单编号’,’客户姓名’:’新客户姓名’}) 对行索引进行重新命名
37、df.rename(columns={1:’一’,2:’二’}) 对列索引进行重新命名
38、df.reset_index() 默认将全部index转化为column
39、df.reset_index(level=0) 将0级索引转化为column
40、df.reset_index(drop=True) 删除原有索引
四、数据选择
:Python pandas库159个常用方法使用说明
文章图片

文章图片

41、df[[‘ID’,’姓名’]] 多个列名要装入list
42、df.iloc[[1,3],[2,4]] 用行列编号选择数据
43、df.iloc[1,1] 选取表中的第3行2列数据 , 第一行默认为列索引
44、df.iloc[:,0:4] #获取第1列到第4列的值
45、df.loc[‘一’] #loc用行名选取的行数据 , 格式是Series , 但可以用列表形式访问
46、df.loc[‘一’][0] 或 df.loc[‘一’][‘序号’]
47、df.iloc[1]#iloc用行编号选取行数据
48、df.iloc[[1,3]]#多行编号选取行数据 , 要用list封装 , 不然变成行列选取
49、df.iloc[1:3]#选择第二行和第四行
50、df[df[‘年龄’]51、df[(df[‘年龄’]52、df.iloc[[1,3],[2,4]] 相当于df.loc[[‘一’,’二’],[‘年龄’,’ID’]] #loc是名 , iloc是编号
53、df[df[‘年龄’]
Df[‘ID’]#可进行>
datetime(2018,08,05)]
116、df[(df[‘成交时间’]>datetime(2018,08,05))&(df[‘成交时间’] 117、cha=datatime(2018,5,21,19,50)-datatime(2018,5,18,17,50)
118、 cha.days#返回天的时间差
119、 cha.seconds#返回秒的时间差
120、 cha.seconds/3600#返回小时的时间差
121、datatime(2018,5,21,19,50)+timedelta(days=1)#往后移一天
122、datatime(2018,5,21,19,50)+timedelta(seconds=20)#往后移20秒
123、datatime(2018,5,21,19,50)-timedelta(days=1)#往前移一天
八、数据透视表
:Python pandas库159个常用方法使用说明
文章图片

文章图片

124、df.groupby(‘客户分类’).count()#客户分类后求数运算
125、df.groupby(‘客户分类’).sum()#客户分类后求和运算
126、df.groupby(‘客户分类’,’区域分类’).sum()#多列分类后求和运算
127、df.groupby(‘客户分类’,’区域分类’)[‘ID’].sum()#多列分类后ID求和运算
128、df[‘ID’]#DataFrame取出一列就是Series类型
129、df.groupby(df[‘ID’]).sum() 相当于 df.groupby(‘ID’).sum()
130、df.groupby(‘客户分类’).aggregate([‘sum’,’count’]# aggregate可实现多种汇总方式
131、df.groupby(‘客户分类’).aggregate({‘ID’:‘count’,’销量’: ‘sum’})
132、# aggregate可针对不同列做不同的汇总运算
133、df.groupby(‘客户分类’).sum().reset_index()#分组汇总后再重置索引 , 变为标准DataFrame
134、pd.pivot_table(data,values,index,columms,aggfunc,fill_value,margins,dropna,margins_name)
135、数据透视表 , data:数据表df,values:值 , index:行索引 , columns:列索引 , aggfunc:values的计算类型 , fill_value:对空值的填充方式;margins:是否有合计列;margins_name:合计列的列名
136、pd.pivot_table(df,values=[’ID’,‘销量’],index=’客户分类’,columms=‘区域’,aggfunc={‘ID’:‘count’,’销量’:‘sum’}),fill_value=http://www.sos110.com/show/12/98329/0,margins=Ture,dropna=None,margins_name=’总计’)


推荐阅读