背景大数据的 ETL(Extract-Transfer-Load) 过程的 Transfer 阶段,需要对 json 串数据进行转换“拍平”处理 。
亲测!超好用 Hive 内置的 json 解析函数 一文中详细介绍过 get_json_object 和 json_tuple 函数如何对 json 串进行有效解析,但美中不足的是这两个函数都无法解析 json 数组,只能解析单个 json 串 。
这里将会介绍 Hive 中常用于 json 数组的解析函数及详细使用方法 。
json数组解析:需求1数据准备例如:Hive中有一张 test_json 表,表中 json_data 字段的内容如下:
文章插图
基于以上的 json_data 数据,现需要将以上 json 串数据解析为如下结构数据:
文章插图
在进行解析之前,先来了解下面两个函数的使用方法 。
函数运用1. explode函数语法
explode(Array|Map)
说明explode()函数接收一个 array 或者 map 类型的数据作为输入,然后将 array 或 map 里面的元素按照每行的形式输出 。
即将 Hive 一列中复杂的 array 或者 map 结构拆分成多行显示,也被称为列转行函数 。
举例
array测试sql语句:
select explode(array('user_id','name','age'));
执行结果:文章插图
map测试sql语句:
select explode(map('user_id',1,'name','rocky','age',18));
执行结果:文章插图
2. regexp_replace函数语法
regexp_replace(str A, str B, str C)
说明语法含义:将字符串 A 中的符合正则表达式 B 的部分替换为 C 。
注意:当字符串 A 中有一些特殊字符时,在正则表达式 B 中要使用转义字符 。
举例
sql语句:
select regexp_replace('hello world!', '\ |\!', '');
执行结果:文章插图
3. 具体函数运用了解 explode 函数与 regexp_replace 函数的使用规则后,现在来完成上面数据准备中提出的解析需求 。
第一步解析:json数组拆分成多行
sql语句:
SELECT explode(split(regexp_replace(regexp_replace('[{"user_id":"1","name":"小琳","age":16},{"user_id":"2","name":"小刘","age":18},{"user_id":"3","name":"小明","age":20}]','\[|\]' , ''), 将json数组两边的中括号去掉'\}\,\{' , '\}\;\{'), 将json数组元素之间的逗号换成分号'\;') 以分号作为分隔符(split函数以分号作为分隔));
执行结果:文章插图
第二步解析:json数组key转列字段
sql语句:
select json_tuple(json, 'user_id', 'name', 'age')from (select explode(split(regexp_replace(regexp_replace('[{"user_id":"1","name":"小琳","age":16},{"user_id":"2","name":"小刘","age":18},{"user_id":"3","name":"小明","age":20}]','\[|\]' , ''),'\}\,\{' , '\}\;\{'),'\;'))as json) tmp;
执行结果:文章插图
json数组解析:需求2数据准备例如:
Hive中有一张 data_json 表,表中 goods_id 和 str_data 字段的内容如下:
文章插图
基于以上的 goods_id 和 str_data 数据,现需要将以上 json 串数据解析为如下结构数据:
文章插图
在进行解析之前,先来了解下面两个函数的使用方法 。
函数运用1. lateral view函数说明
lateral view 用于和 split, explode 等 UDTF 一起使用,它能够将一列数据拆成多行数据,在此基础上可以对拆分后的数据进行聚合 。
lateral view 首先为原始表的每行调用 UDTF,UDTF 会把一行拆分成一行或者多行,lateral view 在把结果组合,产生一个支持别名表的虚拟表 。
推荐阅读
- Mysql统计近30天的数据,无数据的填充0
- 牙周病严重吗
- 历史悠久的福建茶文化
- 牙痛是什么病的前兆
- 眉毛纹坏了怎么淡化
- 脸上的晒斑怎么淡化
- 面包机的做法家庭做法比例 面包机怎么做面包
- 如何淡化唇毛的小妙招
- 抖音上电影剪辑视频怎么做的 怎么做的
- 淡化痘印最有效的方法