hive分割槽表的建立以及代替MR程式設計

2021-09-26 10:48:25 字數 1690 閱讀 7721

分割槽表

create external table track_info(

ip string,

country string,

province string,

city string,

url string,

time string,

page string

) partitioned by (day string)

row format delimited fields terminated by '\t'

location '/project/trackinfo/';

crontab表示式進行排程

之後將清洗過後的資料載入進去分割槽表

統計省份

select province,count(*) from track_info where day='2013-07-21' group by province;
省份統計表

統計的資料已經在hive表track_info_province_stat而且這個表是乙個分割槽表,後續統計報表的資料可以直接從這個表中查詢,也可以將hive表中的資料匯出到關係型資料庫中去(sqoop)

第一步:etl

第二步:把elt中輸出中的資料載入到track_info分割槽表中去

第三步:各個維度統計結果的資料輸出到各自維度的表裡(track_info_province_stat)

第四步:將資料匯出(optional)

hive 分割槽表 Hive的DDL分割槽表建立

1.單分割槽表 建立表t user,指定分割槽hive xiaoliu create table t user id int,name string partitioned by country string row format delimited fields terminated by xia...

hive 建立分割槽表

必須在表定義時建立partition a 單分割槽建表語句 create table day table id int,content string partitioned by dt string 單分割槽表,按天分割槽,在表結構中存在id,content,dt三列。以dt為資料夾區分 b 雙分割...

hive建立分割槽表

靜態分割槽去掉源資料分割槽列後執行 記得指定ymd 2019 10 10 1.建立分割槽表 create tabletemp pilesmallint,mp smallint,carownerint,hmsint partitioned by ymd int row format delimited...