hive基本用法

2021-08-19 19:24:31 字數 2612 閱讀 4744

hive 刪除分割槽

alter table  pdm.mkt_asset_star_71 drop partition (end_dt='3000-12-31');

alter table  pdm.mkt_asset_star_71 drop partition (end_dt='2017-02-26');

三分之一時間處理

from_unixtime(unix_timestamp(a.last_upd,'yyyy-mm-dd:hh:mm:ss') + 28800,'yyyy-mm-dd')  as last_upd_dt,

時間戳處理

from_unixtime(unix_timestamp(state_dt,'yyyy/mm/dd hh:mm:ss'),'yyyy-mm-dd hh:mm:ss.0' )as state_dt

轉碼

iconv -f gbk -t utf-8 /inter4/ods/bak/20170401/loc_telecom_area_1_0020170401.dat -c -o /inter4/ods/data/20170401/loc_telecom_area_1_0020170401.dat

iconv -f gbk -t utf-8 aaa.dat -o aaa_test.dat

put

hadoop fs -put /user/sjzx_b/data/get_data/zcj_test/

getshow create table

hadoop fs -get /user/sjzx_b/hive/sjzx_test.db/jx_yidong_zaiwang_user_201607/

檔案合併 cat

scp  

scp 000000_0 [email protected]:/att/init

load

load data inpath /user/sjzx_b/data/get_data/zcj_test/xx.txt

overwrite into table sjqy.xx;

hive 建立表結構

drop table if exists pdm.ofr_asset_relate_hist_$;\n

create table if not exists pdm.bak_ofr_cdsc_grp_agree_info_z(

agree_info_row_id      string         comment '群組協議唯一編號' 

,agree_row_id           string        comment '群組協議號'       

,cdsc_row_id            string        comment '優惠唯一編碼'     

,cdsc_eff_dt            date          comment '生效時間'         

,cdsc_exp_dt            date          comment '失效時間'         

,cdsc_para_num          decimal(18,0) comment '引數個數'         

,cdsc_para1             string        comment '引數1'             

,etl_time               string        comment '資料入庫時間'

)partitioned by (etl_wk int)

row format delimited fields terminated by ','   

hbese 和 hive 的區別

hive :使用mr封裝的資料倉儲工具,不是資料庫。一般用來做分析業務使用 不直接接入業務

hive 將hql 語句封裝成mapreduce 執行再yarn 平台上

hbase :是乙個面向列的非關係型資料庫 分布式架構

核心功能 是用來儲存和檢索資料 可以直接接入業務系統

不依賴yarn 和mapreduce

zookeeper 是乙個分布式的 開放原始碼的應用協調服務  配置維護 網域名稱維護 分布式同步的

目標 就是封裝好容易出錯的服務。把簡單易用的介面和服務提供給使用者

hive 中join 機制和原理

hive 中 join 有兩種

common join  一般是在reduce 端來完成join 

map join 

common join 分為 3中

map  端 將 on 條件中的key 組合起來

shuffle  階段進行 key value 組合 也就是 hash 兩個表中相同的key 在同乙個表中

reduce   通過key的值完成 join 操作

map jion  通過設定 最小表的 檔案大小引數

hive.mapjoin.smalltable.filesize   原理就是將小表載入到記憶體當中  能夠快速的實現

hive基本總結

1,hive支援的型別 tinyint tinyint型別 smallint smallint型別 int int型別 bigint bigint型別 主要用於狀態,類別,數量的字段 boolean boolean型別 float float型別 double double型別 主要用於金額的字段 ...

hive基本操作

1.顯示所有資料庫 show databases 2.使用某個資料庫 use xx xx表示某個資料庫名 3.顯示某資料庫下的所有表 show tables 4.檢視表結構 顯示各欄位 desc 表名 5.資料匯出到本地 在hive中操作 insert overwrite local directo...

Hive基本使用

啟動hadoop sbin start all.sh 啟動hive bin hive 建立表 create table table name col name data type comment col comment create table hive wordcount context stri...