Pandas是Python第三方库 , 提供高性能易用数据类型和分析工具 , pandas 是基于NumPy 的一种工具 , 该工具是为了解决数据分析任务而创建的 。Pandas 纳入了大量库和一些标准的数据模型 , 提供了高效地操作大型数据集所需的工具 。pandas提供了大量能使我们快速便捷地处理数据的函数和方法 。
与numpy对比区别:
文章插图
image
2.pandas库怎么用
安装
pip install pandas
导入
import pandas as pd
3.pandas两个数据类型
两个数据类型:Series, DataFrame
Series类型
Series类型由一组数据及与之相关的数据索引组成
文章插图
image
第一列的0 , 1 , 2 , 3是自动索引 , 第二列是实际数据值 , 最后的dtype表示数据类型
文章插图
image
Series类型数据的常见创建方式
python列表
文章插图
image
标量值
文章插图
image
python字典
文章插图
image
ndarray
文章插图
image
Series类型数据的基本操作
获得索引和数据
文章插图
image
更改索引
文章插图
image
索引
文章插图
image
切片
文章插图
image
DataFrame类型
DataFrame类型由共用相同索引的一组列组成 , 是一个表格型的数据类型 , 每列值类型可以不同 , 既有行索引、也有列索引 , 常用于表达二维数据 。
文章插图
image
文章插图
image
【数据分析-pandas库快速了解】DataFrame类型数据的常见创建方式
二维ndarray对象
文章插图
image
一维ndarray、列表、字典、元组或Series构成的字典
文章插图
image
文章插图
image
文章插图
image
DataFrame类型数据的基本操作
获得行列索引和数据
文章插图
image
更改行列索引
文章插图
image
选择数据
索引切片获取列数据和单个数据
文章插图
image
索引切片获取行数据
文章插图
image
iloc():按照索引的位置来选取 , 这里要注意这种方式是包含切片的末尾的数据的
文章插图
image
loc():按照索引index的值选取 , 如果没有自定义值 , 行数据也可以通过切片获取 。
文章插图
image
文章插图
image
文章插图
image
4.查看数据
文章插图
imag数据分析-pandas库快速了解e
5.文件数据读取和保存
保存
文章插图
image
读取
推荐阅读
- 在华为鲲鹏服务器的OpenEuler操作系统中快速部署OpenGauss数据库
- 重发:Bqplot是一款用于Jupyter的交互式2D的python绘图库
- 6个MySQL GUI工具,数据库管理必备
- 2020年适用于任何团队的5大数据库文档工具
- Python通过MySQLdb访问操作MySQL数据库
- 适合数据库初级人员 常用的sql语句集合
- 快速提升Python数据分析能力的七个神奇方法
- UI组件库-表格高度自适应
- 「热荐」学好SQL数据库基本功,老K推荐这12本书
- 面试题-Mysql数据库优化之垂直分表