导读:Python数据工具箱涵盖从数据源到数据可视化的完整流程中涉及到的常用库、函数和外部工具 。其中既有Python内置函数和标准库,又有第三方库和工具 。
这些库可用于文件读写、网络抓取和解析、数据连接、数清洗转换、数据计算和统计分析、图像和视频处理、音频处理、数据挖掘/机器学习/深度学习、数据可视化、交互学习和集成开发以及其他Python协同数据工作工具 。
作者:宋天龙
如需转载请联系大数据(ID:hzdashuju)
文章插图
为了区分不同对象的来源和类型,本文将在描述中通过以下方法进行标识:
- Python内置函数:Python自带的内置函数 。函数无需导入,直接使用 。例如要计算-3.2的绝对值,直接使用abs函数,方法是
- Python标准库:Python自带的标准库 。Python标准库无需安装,只需要先通过import方法导入便可使用其中的方法 。例如导入string模块,然后使用其中的find方法:
- 第三方库:Python的第三方库 。这些库需要先进行安装(部分可能需要配置) 。
- 外部工具:非Python写成的库或包,用于Python数据工作的相关工具 。
01 文件读写
文件的读写包括常见的txt、Excel、xml、二进制文件以及其他格式的数据文本,主要用于本地数据的读写 。
文章插图
1. open(name[, mode[, buffering]])