hive之建立桶表

2022-05-12 15:43:04 字數 1144 閱讀 5185

1.建立桶表,用id進行分桶,分3個桶,行結束符用","

$hive>create table t6(id int,name string,age int) clustered by (id) into 3 buckets row format delimited fields terminated by ','

2.載入資料到桶表,按照桶id進行hash儲存到不同的檔案中。

$hive>load data local inpath '/home/centos/customers.txt' into table t6;//載入資料不會進行分桶操作

3:向桶表中插入資料。

$hive>insert into t6 select id,name,age from tx;//該過程是個mr的過程,查詢tx表資料插入到t6表的過程

4:分割槽表是在目錄的層面進行過濾,桶表是在儲存檔案的情況下進行過濾,桶表在進行hash之後,劃分在同乙個桶不同的段裡面。

5.hive中的內連線查詢

先載入資料到兩個表中去:load data local inpath '/home/centos/customers.txt' into table customers;

$hive>select a.,b. from customers a,orders b where a.id=b.cid;

6.hive中的左外連線查詢:$hive>select a.,b. from customers a left outer join orders b on a.id = b.cid ;

右外連線:$hive>select a.,b. from customers a right outer join orders b on a.id =b.cid;

7.explode,炸裂,表生成函式,這個函式是將字串按照空格來進行切割,切成多條記錄,就是切割成乙個乙個的單詞

使用hive實現單詞統計:

//第一步:建表

$hive>create table doc1(line string) row format delimited fields terminated by ' ';

//第二步,載入文件進來

load data local inpath '/home/centos/customers.txt' into customers ;

hive建立分區分桶表

在hive中要建立分割槽表的語句為 partition create table rating table p userid string,movieid string,rating string partitioned by dt string row format delimited field...

Hive 之建立表

下面來繼續分享並記錄hive相關 1 建立表 1 建立表有兩個字段 2 建立表帶有分割槽 2 檢視表 檢視所有表的列表 hive show tables 通過正規表示式檢視表 hive show tables s 檢視表字段 hive describe fruits 3 更改或刪除表 1 修改表名 ...

hive分桶表join Hive分桶表

測試資料 95001,李勇,男,20,cs 95002,劉晨,女,19,is 95003,王敏,女,22,ma 95004,張立,男,19,is 95005,男,18,ma 95006,孫慶,男,23,cs 95007,易思玲,女,19,ma 95008,李娜,女,18,cs 95009,夢圓圓,女...