Pandas的crosstab函数( 四 ) 介绍我很喜欢DataCamp上的“Seaborn中

文章插图
右下角的单元格将始终包含观察的总数，或者如果“normalize”设置为True ，则为1：
pd.crosstab(index=diamonds['cut'],columns=diamonds['clarity'],margins=True,margins_name='Total Percentage',normalize=True)
文章插图
请注意，如果将margins设置为True ，则热图是无用的。
Pandas crosstab() ，多组对于index和columns参数，可以传递多个变量。结果将是一个具有多级索引的数据帧。这次我们插入所有的分类变量：
pd.crosstab(index=[diamonds['cut'], diamonds['clarity']],columns=diamonds['color'])
文章插图
对于index ，我传递了color和cut 。如果我把它们传递给列，结果将是一个包含40列的数据帧。如果你注意的话，多级索引如预期的那样命名为cut和clear 。对于存在多级索引或列名的情况， crosstab()有方便的参数来更改它们的名称：
pd.crosstab(index=[diamonds['cut'], diamonds['clarity']],columns=diamonds['color'],rownames=['Diamond Cut', 'Clarity']).head()
文章插图
传递相应名称的列表，以将索引名称更改为行名称。这个过程对于控制列名的colnames是相同的。
有一件事让我很惊讶，如果你把多个函数传递给aggfunc ， pandas就会抛出一个错误。同样， StackOverflow上的伙计们认为这是一个bug ，而且已经有6年多没有解决过了。
最后要注意的是，在pivot_table()和crosstab()中，都有一个dropna参数，如果设置为True ，则会删除包含所有nan的列或行。

Pandas的crosstab函数( 四 )

推荐阅读

山西省晋城市委秘书长王晋峰涉嫌严重违纪违法被查

削骨手术过程是怎样的？

#茜茜的菜谱#剁椒魔芋豆腐、嫩炒猪肝、五花肉焖干豆角这几道家常菜的做法

壹站新项目拟落户奉贤，助力3PL数字化运营转型

忠告|忠告红豆不能与此物一起吃, 混着吃“会致命”, 别傻傻以为好

丹尼斯·尼尔逊|3集播完拿下8.7分，这部新剧创下新的收视纪录

让技术更有温度，华为联合伙伴发布Cloud for Good 行动倡议

华为Mate30华为Mate 40系列首发屏下摄像头！小米：下次安排

女性性生活越湿越短命吗?

[德斯]82284.6欧元起售新款梅赛德斯-AMG E级开启预定

郭德纲 |“德云社”成员集体换女装啥样？郭德纲辣眼睛，岳云鹏油腻，全场最佳还是他

世名科技|世名科技：实际控制人吕仕铭解除质押55万股

#周易专家指迷居士#指迷居士十二生肖2024年正月初一算命运气预测

为啥李冰冰总忍不住飙英语

苏子的历史|他这么做对秦国而言，意义何在？，商鞅变法禁止父子兄弟同宅居住

嫁祸|滴翠亭偷听事件，薛宝钗嫁祸黛玉，如果被黛玉知晓会有什么反应？

智投期市|相信会给你很多启示，上，期货交易大师——斯坦利克罗的交易箴言

「体坛吧咖」猛龙却还是强队！，若球队失去了核心会怎样？骑士秒变鱼腩球队

小米11没抢到？卢伟冰支招：小米之家准备了较多货源

天真童趣的诗词?写孩童调皮的古诗有哪些