10个数据可视化技巧,让你一看就懂

来源:数据分析1480
ID:lsxxx2011
作者:数据分析1480
 

10个数据可视化技巧,让你一看就懂

文章插图
 
 
我必须对你说实话:当我学习数据科学时,我完全低估了绘图的重要性 。没错,那时一切都一团糟:我从头开始学习 Python、熟悉了所有可能的算法、理解了所有东西背后的数学原理,但是我的绘图技巧很糟糕 。
 
为什么会这样?我们总是在做同样的事情 。你知道的:pairplots,distplots,qqplots…你在可视化数据时使用图表是理解数据的唯一方法 。这些都是非常有用、通用和默认的图表 。所以,复制和粘贴一堆代码成了我时最常做的事情 。
 
10个数据可视化技巧,让你一看就懂

文章插图
 
 
对于我的项目来说,可交付结果总是一个模型 。由于数小时的数据清洗和特征工程,很可能会有一个不错的分数 。我是我项目的唯一参与者,我的教授们在他们给我这些数据时就已经知道关于数据的一切 。那我作图是为了给谁看?我自己?好吧…没必要!对不?我比任何人都清楚每一步在实现什么,我不需要向任何人解释 。
 
我相信这可能是我在数据科学中的最大失败:没有充分考虑可解释性和可解释性的重要性 。你可能是个天才,但如果你不能向第三方解释你是如何得到这些美妙的结论,以及为什么得到这些结论,那么你可能什么都不是 。
 
例如,在 Ravelin Technology,我们提供基于机器学习的欺诈预防解决方案 。想象一下,你告诉一个客户,你封锁了 x% 的交易,只是因为机器学习模型是这样说的,但你根本不知道为什么要这样做会怎样?当然,对于任何试图最大化环化率和销售情况的电子商务来说,这都不是很有吸引力,对吧?想象一下,在医疗保健等其他敏感领域出现同样的情况……那简直是灾难即将来临的千兆 。
 
现在,除了与业务相关的问题,甚至从法律的角度或者从你的业务只关心预测的结果来看——不管你如何得到它们,理解一个算法实际上是如何工作的对你会有帮助 。你不仅能更好地向客户解释输出的原因,还能更好地协调数据科学家和分析师的工作 。
 
能够向人们解释你的思维过程是任何数据相关工作的关键部分 。在这种情况下,复制和粘贴图表是不够的,图表的个性化变得非常重要 。
 
在这篇文章的剩余部分,我想和大家分享 10 个基本的中级和高级的绘图工具 。我发现在现实生活中,当涉及到绘图解释你的数据时,这些工具非常有用 。
 
我将在下面几行中引用的库:
Seaborn:import seaborn as snsmatplotlib:matplotlib.pyplot as plt 
此外,如果需要,可以设置样式和你喜欢的格式,例如:
 
???plt.style.use('fivethirtyEight')%config inlinebackend.figureformat='retina'%matplotlib inline 
说到这里,让我们直接跳到这些工具:
 
绘制符合图
 
有时,你会想在一个图表中绘制出不同的东西 。但有时,你会希望在同一行或列中抛出不同的图表,相互补充和/或显示不同的信息片段 。
 
为此,这里给出一个非常基本但必不可少的工具:subplots 。如何使用它?很简单 。matplotlib 中的图表是一种结构,可以这样使用:
 
图形:绘制图表的背景或画布
轴:我们的图表
 
通常,这些东西是在代码后台自动设置的,但是如果要绘制多个图形,我们只需要按照以下方式创建图形和轴对象:
 fig, ax = plt.subplots(ncols=number_of_cols, nrows=number_of_rows, figsize=(x,y) 
例如,如果设置 ncols=1 和 nrows=2,我们将创建一个由 x,y 轴组成的图形,其中只有两个图表,分布在两个不同的行中 。剩下的唯一事情是从 0 开始使用'ax'参数指定不同绘图的顺序 。例如:
 
???????sns.scatterplot(x=horizontal_data_1, y=vertical_data_1, ax=ax[0]);sns.scatterplot(x=horizontal_data_2, y=vertical_data_2, ax=ax[1]); 
轴标签
 
这可能看起来没有必要,或者不是很有帮助,但是你无法想象,如果你的图表有点混乱,或者看到数据的人对此不是很熟悉,你会被问多少次 x/y 轴代表的是什么 。按照前面的两个绘图示例,如果要为轴设置特定名称,则必须使用以下代码行:
???????ax[0].set(x label='My X Label',ylabel='My Y Label')ax[1].set(xlabel='My Second X Label',ylabel='My Second and Very Creative Y Label')


推荐阅读