读芯术|Python抓取国家医疗费用数据:哪个国家花得最多、哪个花得最少?( 三 )
数据帧
绘制图表之前 , 必须使用Pandas准备一个数据帧 。 首先我们得明确DataFrame是什么:
DataFrame是一个二维大小可变的、潜在的异构表格式数据结构 , 带有标记的轴(行和列) 。 创造一个数据帧非常简单直接:
df = pd.DataFrame(Data,columns=[‘country’, ‘expense’])
可视化
我们大部分时间都花在收集和格式化数据上 , 现在到了做图的时候啦 , 可以使用matplotlib和seaborn 来可视化数据 。 如果不太在意美观 , 可以使用内置的数据帧绘图方法快速显示结果:
df.plot(kind = ‘bar’, x=’country’, y=’expense’)plt.show
现在 , 结论出来了:许多国家每天的支出都低于一美元 。 这些国家中大多数都位于亚洲和非洲 , 看来世界卫生组织应更关注这些国家 。
本文插图
图源:unsplash
这不一定是一个值得出版的图表 , 却是结束一个小项目的最佳方式 。
学习技术技能最有效的方法就是动手实践 。 学习的过程比最终的结果更重要 , 在这个项目中 , 展示了如何使用3项关键的数据科学技能:
· 网页抓取:检索联网数据
· BeautifulSoup:分析数据以提取信息
· 可视化:展示所有的努力
比起技术更重要的是 , 找到自己感兴趣的项目 , 不一定是能够改变世界的事物才具有价值 , 从生活中探索有趣的项目吧 。
本文插图
留言点赞关注
我们一起分享AI学习与发展的干货
如转载 , 请后台留言 , 遵守转载规范
本文为***作者原创 , 未经授权不得转载
推荐阅读
- 读芯术|今日芯声——智能音箱四川话卖瓜,吸引老外前来买瓜
- 代码|为了更好的代码:12个Python小窍门
- 编程语言|Python 编程语言的核心是什么?
- 中国统计网|Python实战项目:我做出了最强连连看!!
- |计算机视觉技术帮助机器人更好抓取透明物体
- 版本|Python 3.8.4 正式发布
- 读芯术|抖音的奇幻漂流:为什么TikTok让用户如此着迷?
- 发布|再不知道就Out了!赶紧看看新发布的Python 3.9这些独特新功能
- 智能机器人|几种主流工业机器人智能抓取系统方案分享
- 大数据&云计算|python数据挖掘常用工具有哪几种?