Hive 保證資料有序

2021-09-19 05:39:17 字數 921 閱讀 5338

可以強制開啟排序

set hive.enforce.sorting=true;

或者使用其他sql的實現

使用其他sql的實現

set mapreduce.job.reduces=4;

建立表

create table if not exists buc3(

sno int,

sname string,

*** string,

sage int,

sdept string

)clustered by (sno) sorted by (sage desc) into 4 buckets

row format delimited

fields terminated by ','

stored as textfile

;

載入資料

insert overwrite table buc3

select * from t_stu

distribute by (sno) sort by (sage desc)

;

select * from buc3;
要保證有序,reduce數量必須和分桶數量一致

可以使用

set hive.enforce.sorting=true;
insert overwrite table buc2

select * from t_stu

cluster by (sno)

;

這種實現也保證資料是有序的

資料有序 資料運營部 有序推進重點專案建設

資料運營部 有序推進重點專案建設財務管控uap大版本公升級工作是2020年資料運營部重點工作之一,因省公司財務工作需求,要求於5月中旬完成該專案。該專案實施難度大,工期緊,為保證專案如期保質保量完成,資料運營部在疫情期間,一方面做好廠商人員防疫工作,另一方面了解業務部門業務需求,積極協調軟硬體資源和...

LinkedHashMap如何保證有序

我們常說linkedhashmap是有序的,這個有序也是分為兩種的,分別是 插入順序和訪問順序,我們可以通俗的認為 linkedhashmap hashmap 雙向鍊錶 以下的學習是基於jdk8 根據linkedhashmap的結構來看,是依賴於hashmap的,通過檢視原始碼,我們也會發現,lin...

kafka如何保證訊息有序

兩種方案 方案一,kafka topic 只設定乙個partition分割槽 方案二,producer將訊息傳送到指定partition分割槽 解析 方案一 kafka預設保證同乙個partition分區內的訊息是有序的,則可以設定topic只使用乙個分割槽,這樣訊息就是全域性有序,缺點是只能被co...