HIVE解析json格式資料

2021-10-07 14:29:15 字數 765 閱讀 1727

| id | conditions |

|312|,,]}

|313|,,]}|

第一步:我們可以看到conditions欄位下的json格式資料,是json串裡面套著類似於list結構,我們先取出。
get_json_object(conditions,

"$.diyitems"

)取出之後資料是這樣的:

[,,]

第二步:我們把list結構中每個元素拿出來形成陣列,方便後期列轉行。
split(regexp_replace(regexp_replace(get_json_object(conditions,

"$.diyitems"),

'\\[\\]',''

),'},\\]"換成" "然後按照"},]',''

),'},\\{'

)) jsstr as newjson

ps:str_to_map(newjson,

",",

":")第二個引數","區分每個k-v對,第三個引數區分每個k與v

the end

id1,

510723474755551232,80

id1,

495134318704852992,90

....

....

.

Hive解析json格式資料

本文將介紹兩個使用hive解析json的小demo 1.hadoop hadoop001 jsondata more rating.json 很多資料.hive hwzhdb create table parsejson jsondata string oktime taken 0.146 seco...

Hive解析json格式字段

新建hive表 create external table asmp.json test id string,info string row format delimited fields terminated by t lines terminated by n location hdfs nam...

Hive 解析複雜json格式字段

本篇文章中所使用的方法來自部落格hive中的lateral view 與 explode函式的使用,感謝大佬的分享。一.問題背景 資料來源hive資料表結構如下 其中info欄位的資料型別為string格式的複雜json結構,例如 需求現在需要統計每個id 中info欄位所對應的使用者數量,而最關鍵...