现在程序员进行数据分析都在用Excel?Python才是时代的趋势

我是个只会用Excel的数据分析工作者 。有一天,我和朋友约好晚上一起吃饭,离下班还有5分钟,老板突然Q我:

老板:你今天加个班
我:好呀好呀
老板:我有几个Excel,需要你把它们合成一张表
我:好呀好呀
老板:给!你自己看着办吧!
我怀着忐忑的心情打开了一个神秘的压缩包:
现在程序员进行数据分析都在用Excel?Python才是时代的趋势

文章插图
 
912个CSV表格,每个表格共370列,约360行不等
这么多!我试了一下Power Query, 电脑不客气地歇菜了,这要是纯手动复制非得睡公司不可 。我瘫在工位上:“我今天怕是得和912张表共度良宵 。”
朋友听完来龙去脉却哈哈一笑:“小事一桩,今晚这 饭还真得吃定了,看我的!”
我半信半疑看着朋友打开一个黑色的窗口,刷刷刷敲了几行代码,一份合并好的表格就很快完成了!
现在程序员进行数据分析都在用Excel?Python才是时代的趋势

文章插图
 
屏幕上甚至还跳出了时长:
现在程序员进行数据分析都在用Excel?Python才是时代的趋势

文章插图
 
顺利下班!之前我总觉得Excel能做好多事情,自己学习动力也不是特别强,很多时候都得过且过,并且看到代码有点望而生畏,看起来好像很难的亚子,但没想到这么方便 。
我坐不住了:鹏哥,你会的这个代码,怎么这么厉害,比Excel还好用啊?
大鹏神秘一笑:Python可强大了,远不止你看到的这些 。
Python的强大之处No.1 效率高,可复用刚才处理表格的效率你看到了,更厉害的是如果有类似的工作任务,我们只需要更改一下工作路径,这份代码便可以直接使用,可谓一劳永逸 。
除了合并表格这类需求,批量出图是不是也曾经困扰你?想想你用Excel怎么做数据分析的:
现在程序员进行数据分析都在用Excel?Python才是时代的趋势

文章插图
 
从数据的清洗整理到出图的每一步都要鼠标点击,非常繁琐且容易出错,而使用Python只需几行代码即可轻松出图:
现在程序员进行数据分析都在用Excel?Python才是时代的趋势

文章插图
 
当你面对高重复性的工作时,也只需要略微改动,或者引入循环,再也不用点鼠标点到手抽筋了 。
我有点心动:好像是比Excel方便多了,会用Python肯定能大大提高工作效率 。
Python的强大之处No.2 功能丰富,涵盖完整的数据工作流就在我在心里为大鹏的表演喊“666”的同时,又滔滔不绝地讲了起来:你别看我前面只提到了使用Python整整表格出出图,人家可是著名的“胶水语言” 。
“胶水语言”是什么?我问道 。
现在程序员进行数据分析都在用Excel?Python才是时代的趋势

文章插图
 
朋友解释道:Python可以利用MySQLdb库连接数据库,可以利用pandas和matplotlib进行清洗和分析,可以利用pyecharts进行交互可视化,可以利用numpy和sklearn进行建模,甚至可以利用pyinstaller打包工作流交给同事,共同提效……
现在程序员进行数据分析都在用Excel?Python才是时代的趋势

文章插图
 
而且这些库的丰富程度,可以说是超出你的想象,以python可视化必知基本库matplotlib为例,光是他的官方gallery就有26个大类527个样式,数量上就碾压了市面上大部分同功能软件 。
现在程序员进行数据分析都在用Excel?Python才是时代的趋势

文章插图
 
Python可视化类工具会有针对图表样式进行调整的代码,也可以交互,几行代码,省时省力,分分钟关机下班 。
现在程序员进行数据分析都在用Excel?Python才是时代的趋势

文章插图
 
比较一下Seaborn的图表库和Excel的图表库,感受差距:
现在程序员进行数据分析都在用Excel?Python才是时代的趋势

文章插图
 
这就有点惊讶到我了:这效率和酷炫程度和Excel根本不是一个层级的 。这么游刃有余的本事,不可谓不吸引人啊!会用Python肯定能做更多的事情,让老板刮目相看 。
Python的强大之处No.3 时代所趋,易学好用我随手找了一点资料:Python官方在今年2月做了一份报告,从官方的角度说明了python的使用状况和受欢迎程度 。
 
该调查由 Python 软件基金会与 JetBrains 一起发起,有来自 150 多个国家的超过两万名开发人员参与 。
从官方喜出望外的报告中,我发现python受到大部分人的欢迎,是用户手中的香饽饽:


推荐阅读