[东方瑞通]开启您的Excel大数据ETL应用
PowerQuery作为一个数据预处理工具 , 相当于大数据分析系统中的ETL(ExtractTransformLoad)部分 , 负责完成数据的多数据源获取、清洗、转换、合并、加载等处理工作 , 帮助后期的数据模型分析获得规范、完整的数据源 。
文章图片
ExcelPowerQuery应用在Excel2016专业增强版或更高版本中自带了PowerQuery数据查询组件 。 下图显示的是Office2016和Office365版本中Excel的PowerQuery功能 。
【[东方瑞通]开启您的Excel大数据ETL应用】
文章图片
文章图片
在Excel中与PowerQuery有关的功能都集中在功能区“数据”选项卡中 , 不同版本功能菜单名称略有差别:
文章图片
利用上面的工具我们可以开始数据加载 , 在进行查询编辑时 , Excel会自动打开“PowerQuery编辑器” 。
这里请注意 , 在“编辑器”操作的时候不能操作Excel窗口 , 包括打开新的电子表格文件 , 也会因为正在打开着PowerQuery编辑器 , 而看不到新打开的文件窗口 。
ExcelPowerQuery数据查询结果加载选项-PowerQuery上载数据选项
Excel中数据查询编辑完成后 , 利用并加载这些数据的方法与PowerBI中有很多区别 。 可以选择将数据返回到工作表、直接生成数据透视表、仅创建连接、加载到数据模型等加载方式 。
文章图片
·表:将数据查询结果返回到Excel工作表中 。 Excel每张工作表有1048576行 , 如果数据记录行高于这个值 , 数据会显示不完整、表格操作速度也会受到影响 。
·数据透视表、数据透视图:将查询数据直接用于生成数据透视图表 , 获得统计结果 , 数据不会在工作表中出现 。
·仅创建连接:将数据源路径、数据查询整理步骤保留 , 不会将数据返回到Excel 。 数据连接配置信息保留在当前的Excel文件中 , 也可以将连接配置保持为文件 。
在做以上3类选择的同时 , 我们还以选择对话窗中的“将此数据添加到数据模型”选项 , 就是将数据保存到Excel中的PowerPivot数据模型中 。 这个选项的经典应用场景是:
·数据源的信息量非常大 , 超过Excel工作表承受范围 , 数据模型可以帮助Excel存储“大数据”信息 , 打破工作表1048576行记录限制 , 并对数据进行压缩 。
·数据分析需要的信息不是在一张表中 , 而是像数据库中的规范结构——分布在几个不同主题的表中 。 表与表需要建立链接关系 , 完成数据查询 , 获取更完整的基础数据 。
PowerQuery与PowerPivot应用流程如下图所示 。 通过这两个组件Excel可以突破工作表中记录行的限制 , 在模型中以列式存储引擎 , 完成大数据统计分析应用 。
文章图片
本文为东方瑞通赵悦老师原创 , 赵老师是微软最有价值专家(MVP)、思维导图专家、微软Office365资深顾问、微软认证讲师(MCT)、微软Office增值风暴计划优秀讲师、微软Office技术俱乐部专家、资深IT项目经理、PMI国际认证项目经理(PMP) , 多次受邀微软技术大会分享技术专题 。
推荐阅读
- IT极客世界iPhone12系列售价曝光,最低仅售4200元,苹果开启“性价比”模式
- 『安卓』不管用的什么安卓机,开启这几个功能,能让你的手机再战三年
- 【华为】麒麟990+40W快充,华为顶级5G旗舰开启降价模式,仅售2.6K,真香!
- #马云#阿里日马云开启直播首秀,谈年轻人压力大:一句话给“骂”醒了
- MIUI▲MIUI开发版重新回归!正式开启MIUI 12全面升级,米6可更新
- iambillbilPlus拥有更强续航,华严苛大容量手机,让您的iPhone7
- 镁客网国产服务器占比超预期,运营商开启大规模服务器集采招标
- 山西倍凡山西倍凡教育将与阿里巴巴开启深度合作模式!
- 【微信】切记:微信就算有密码,也要开启这个“功能”,否则密码将成摆设
- 天下快谈每个月10元,你还会坚持使用吗?,倘若微信开启“收费模式”