是时候来搞机器学习了!Seaborn数据可视化详细操作指南

数据可视化可深入了解数据集中变量之间的分布和关系 。
此洞察力有助于选择在建模之前应用的数据准备以及最适合数据的算法类型 。
Seaborn 是 Python 的数据可视化库,它在流行的 Matplotlib 数据可视化库之上运行,并且提供了简单的界面和美观的图形 。

是时候来搞机器学习了!Seaborn数据可视化详细操作指南

文章插图
 
本文对机器学习中的 Seaborn 数据可视化作了简要介绍 。
看完本文,你将知道:
  • 如何使用条形图,直方图以及箱形图来总结变量的分布 。
  • 如何使用线图和散点图总结关系 。
  • 如何比较同一图上不同类别值的变量的分布和关系 。
概述本教程分为六个部分:
  • Seaborn数据可视化库
  • 线图
  • 条形图
  • 直方图
  • 箱形图
  • 散点图
Seaborn数据可视化库Python 的主要绘图库称为 Matplotlib。
Seaborn 是一个绘图库,它不仅提供了一个更简单的界面,为机器学习所需的绘图提供了合理的默认值,而且最重要的是,这些绘图在外观上比 Matplotlib 更好 。
Seaborn 要求首先安装 Matplotlib 。
我们可以使用 pip 直接安装 Matplotlib ,如下所示:
sudo pip install matplotlib安装后,可以通过输出版本号来确认可以加载和使用该库,如下所示:
# matplotlibimport matplotlibprint('matplotlib: %s' % matplotlib.__version__)我们可以得到 Matplotlib 库的当前版本 。
matplotlib: 3.1.2接下来,也可以使用 pip 安装 Seaborn 库:
sudo pip install seaborn安装好后,我们还可以通过打印版本号来确认可以加载和使用该库,如下所示:
# seabornimport seabornprint('seaborn: %s' % seaborn.__version__)运行示例将打印Seaborn库的当前版本 。
seaborn: 0.10.0要创建 Seaborn 可视化图形,必须导入 Seaborn 库并调用函数来创建图 。
重要的是,Seaborn 绘图功能希望将数据作为 Pandas 数据帧提供 。这意味着,如果你要从CSV文件加载数据,则必须使用


    推荐阅读