『』数据科学家和软件工程师都在用的pandas函数有哪些?( 四 )
本文插图
11.整理
设置非数(NaN)单元格为某个值
设置非数值单元格为0 。 示例中 , 笔者像之前一样创建了相同的数据透视表 , 但不使用fill_value=http://news.hoteastday.com/a/0 , 而是使用 fillna(0)进行填充 。
pivot = pd.pivot_table(tmp_df, values='rating',index=['user_id'], columns=['anime_id'], aggfunc=np.sum)pivot.fillna(0)
本文插图
本文插图
12.其他
采样数据框
笔者一直从较大的数据框中提取少量样本 。 如果frac = 1 , 则可以在保留索引的情况下随机重新排行 。
anime.sample(frac=0.25)
本文插图
迭代行索引
在数据框中迭代索引和行 。
for idx,row inanime[:2].iterrows(): print(idx, row)
本文插图
启动jupyter notebook
以高数据速率限制启动jupyter notebook程序 。
jupyter notebook —NotebookApp.iopub_data_rate_limit=1.0e10
本文插图
图源:unsplash
你最喜欢哪些函数呢?
本文插图
留言点赞关注
我们一起分享AI学习与发展的干货
【『』数据科学家和软件工程师都在用的pandas函数有哪些?】如转载 , 请后台留言 , 遵守转载规范
推荐阅读
- []重庆移动-亚德高等级数据中心落户西永微电园
- 平台■在线视频平台大数据杀熟成惯例 买VIP就活该被宰?
- 「数据线」手机充电慢?那你需要看看是不是这些地方出了问题
- 大数据:这套绝对是2020年大数据最全面的线路图+实战项目+源码限时赠你
- 【Ace】原创 用实际数据发声,OPPO Ace2的这些亮点你要知道
- #颜七公子#TunesKit iPhone Data Recovery for Mac(iPhone数据恢复工具)
- 『挖贝网』网达软件2019年净利3439.68万增长330.28%行业客户拓展
- 邓锄头挖科技■关于IDC数据中心的“容量管理”的目标和3种子业务场景
- 「天文」科学家制造人造彗星,获取DNA成分
- 技术@为楼宇安上“智慧大脑”,翠苑街道开创“一平台”数据互通模式