hive 行轉列和列轉行（筆記）

1．相關函式說明

concat(string a/col, string b/col…)：返回輸入字串連線後的結果，支援任意個輸入字串;

concat_ws(separator, str1, str2,...)：它是乙個特殊形式的 concat()。第乙個引數是剩餘其他引數間的分隔符。分隔符可以是與剩餘引數一樣的字串。如果分隔符是 null，返回值也將為 null。這個函式會跳過分隔符引數後的任何 null 和空字串。分隔符將被加到被連線的字串之間;

collect_set(col)：函式只接受基本資料型別，它的主要作用是將某字段的值進行去重彙總，產生array型別字段。

2．資料準備

表6-6 資料準備

name

constellation

blood_type

孫悟空白羊座a大海

射手座a

宋宋白羊座

b豬八戒

白羊座a

鳳姐射手座

a3．需求

把星座和血型一樣的人歸類到一起。結果如下：

射手座,a 大海|鳳姐

白羊座,a 孫悟空|豬八戒

白羊座,b 宋宋

4．建立本地constellation.txt，匯入資料

[atguigu@hadoop102 datas]$ vi constellation.txt

孫悟空白羊座 a

大海射手座 a

宋宋白羊座 b

豬八戒白羊座 a

鳳姐射手座 a

5．建立hive表並匯入資料

create table person_info(

name string,

constellation string,

blood_type string)

row format delimited fields terminated by "\t";

load data local inpath "/opt/module/datas/constellation.txt" into table person_info;

6．按需求查詢資料

1．函式說明

explode(col)：

將hive一

列中複雜的array或者map結構拆分成多行。

lateral view

用法：lateral view udtf(expression) tablealias as columnalias

解釋：用於和split, explode等udtf一起使用，它能夠將一列資料拆成多行資料，在此基礎上可以對拆分後的資料進行聚合。

2．資料準備

表6-7 資料準備

movie

hive 列轉行和行轉列

1.假設我們在hive中有兩張表，其中一張表是存使用者基本資訊，另一張表是存使用者的位址資訊等，表資料假設如下 user basic info id name1a 2b3c 4duser address name address aadd1 aadd2 badd3 cadd4 dadd5 id na...

hive 列轉行和行轉列

1.假設我們在hive中有兩張表，其中一張表是存使用者基本資訊，另一張表是存使用者的位址資訊等，表資料假設如下 user basic info idname1a 2b3c 4duser address name address aadd1 aadd2 badd3 cadd4 dadd5 我們可以看到...

Hive行轉列和列轉行

優點好理解缺點多次select同一張表，造成計算量成倍增加冗餘，單個select條件複雜後會變得較難維護。concat height height,weight weight,age age as value select id,height as label,height as value...

hive 行轉列和列轉行（筆記）

hive 列轉行和行轉列

hive 列轉行和行轉列

Hive行轉列和列轉行

相關推薦