對現有Hive的大表進行動態分割槽

分割槽是在處理大型事實表時常用的方法。分割槽的好處在於縮小查詢掃瞄範圍，從而提高速度。分割槽分為兩種：靜態分割槽static partition和動態分割槽dynamic partition。靜態分割槽和動態分割槽的區別在於匯入資料時，是手動輸入分割槽名稱，還是通過資料來判斷資料分割槽。對於大資料批量匯入來說，顯然採用動態分割槽更為簡單方便。

- 對現存hive表的分割槽

首先，新建一張我們需要的分割槽以後的表create table like 'origin'

然後，我們修改一下hive的預設設定以支援動態分割槽：

set hive.exec.dynamic.partition=true;

set hive.exec.dynamic.partition.mode=nonstrict;

第二步僅在你僅使用動態分割槽欄位做分割槽索引時。

然後用hive的insert命令進行插入操作。注意，除了所有列外，需要將分割槽的動態欄位跟在後面。

可以看到，動態分割槽的字段支援函式操作。

這樣，我們得到了一張分割槽後的hive大表。

參考：

對現有Hive的大表進行動態分割槽

對Hive的大表進行動態分割槽

Hive中小表與大表關聯 join 的效能分析

Hive中小表與大表關聯 join 的效能分析

對現有Hive的大表進行動態分割槽

對Hive的大表進行動態分割槽

Hive中小表與大表關聯 join 的效能分析

Hive中小表與大表關聯 join 的效能分析

相關推薦