Excel 执行SQL查询函数

之前给大家介绍过,利用Excel内置的SQL查询引擎,来执行查询操作 。通过编写SQL查询语句,可以完成Excel内置函数不能够完成的工作 。带好笔纸做笔记吧,下面通过几个案例,介绍SQL查询语句的基本用法,如果有类似的工作,只需要更改几个地方就可以了 。当然如果条件允许,还是建议你系统学习一下SQL语句,提升下综合技能 。因为Excel内置引擎网络上资料很少,大家可以以SQLSERVER (都是微软的产品,虽有区别,但还是有很大的相通的地方的)教程为模板学习,网络上资料很多 。
使用Excel进行数据处理,不外乎两种应用场景:
数据匹配(数据查找)
数据聚类(求和,平均,总数)
数据素材数据素材为从GitHub上获取关于COVID-19数据集 。如果大家需要素材,请留言回复“ETSQL”获取练习素材 。
这里面要用到一个函数ETSQL,它是EFunction内置的函数 。

Excel 执行SQL查询函数

文章插图
数据素材包括全球和国内的数据
案例1:数据匹配“国家”Sheet表格内对应的是,各个省份每天累计数据和新增数据 。假如需要提取出来上海每天的数据信息 。则SQL语句为:
select * from [国家$] as a where a.省份='上海市'
对于学习过SQL语句的朋友来说,Excel内置引擎,SQL语句和其他关系数据库的查询语法基本相同 。对于未接触SQL语句的朋友来说,可以这样简单理解 。
select 关键词是必须的,表示要查询一个信息关键词,每个语句必须有的 。
from 关键词也是必须的,表示从什么地方查询,Excel表格表示从“国家”这个Sheet之中查询 。
where 关键词也是必须的,表示是查询的筛选条件,它后面跟着的就是筛选条件,案例之中,要求“国家”Sheet表之中,省份等于“上海市”,如果有多个条件使用关键词and 或者or进行连接 。
通过以上语句,就能够将上海每天的数据全部提取出来 。
Excel 执行SQL查询函数

文章插图
从“国家”表格之中提取出上海所有信息
如果要提取出来上海市,2020-40-20日之后所有的数据,则上述SQL语句只需要变为
select * from [国家$] as a where a.省份='上海市' and a.日期>43941 。
对于熟悉MySQL或者MsSQL的朋友来说,Excel之中没有“时间”类型数据,Excel之中只有数值类型数据,Excel之中是以数字表示时间的,43941就对应2020-40-20这一天 。当然在实际应用过程之中,可以使用公式进行拼接SQL语句,Excel会自动将日期转化为数字类型数据处理的 。
案例之中,就是将B1和F1单元格内的数据,进行拼接到A1单元格之中,Excel自动生成SQL完整语句 。
Excel 执行SQL查询函数

文章插图
SQL拼接
如果学习好了SQL查询语句后,再配合ETSQL函数,Excel之中所有匹配函数就可以说拜拜了 。当然SQL语句编写起来没有专用的函数方便 。但SQL很适合用来进行复杂数据匹配工作,这点VLOOKUP,match等函数,是万万没有这个技能的 。所以说没有最好的工具,只有适合的工具 。
案例2:数据聚合(求和,平均、计数)如果要统计上海市,每天新增人数的累加和-累计确诊人数时,这个时候,就可以应用到SQL另外一个强大的功能,数据聚合,这个功能很像Excel自带的透视表功能,这相当于透视表函数化了,我们把Excel语句写好了,只需要F9刷新数据就OK了 。基本语句为
select sum(当日新增) from [国家$] as a where a.省份='上海市'
上述语句通过SQL引擎的sum函数(需要注意这个sum和Excel函数SUM的区别),统计“当日新增”这个字段数据的和,条件是省份为上海市 。
如果说我要统计上海市每天的平均新增人数,该怎么写:
select avg(当日新增) from [国家$] as a where a.省份='上海市'
只需要把sum替换为avg求平均函数就OK了 。如果要统计上海市有多少天有新增确诊记录时,则条件SQL语句为:
select count(当日新增) from [国家$] as a where a.省份='上海市' and a.当日新增>0
【Excel 执行SQL查询函数】count函数为计数统计函数,同时添加了另外一个条件,就是添加了当日新增人数大于“0”值的数据 。


推荐阅读