大資料之Hive DML資料操作 七

2021-10-14 16:25:35 字數 1277 閱讀 2068

1.排序

1-1. 全域性排序(order by)

order by:全域性排序,只有乙個reducer

1.使用 order by 子句排序

asc(ascend): 公升序(預設)

desc(descend): 降序

2.order by 子句在select語句的結尾

3.案例實操

(1)查詢員工資訊按工資公升序排列

hive (default)> select

*from emp order by sal

;

(2)查詢員工資訊按工資降序排列

hive (default)> select

*from emp order by sal desc;

1-2. 按照別名排序

按照員工薪水的2倍排序

hive (default)> select ename,

sal*2 twosal from emp order by twosal;

1-3. 多個列排序

按照部門和工資公升序排序

hive (default)> select ename, deptno,

salfrom emp order by deptno,

sal;

1-4 .每個mapreduce內部排序(sort by)

sort by為每個reducer產生乙個排序檔案。每個reducer內部進行排序,對全域性結果集來說不是排序。

1.設定reduce個數

hive (default)> set mapreduce.job.reduces=3;
2.檢視設定reduce個數

hive (default)> set mapreduce.job.reduces;
3.根據部門編號降序檢視員工資訊

hive (default)> select

*from emp sort by deptno desc;

4.將查詢結果匯入到檔案中(按照部門編號降序排序)

hive (default)> insert overwrite local directory '/opt/module/datas/sortby-result'

select

*from emp sort by deptno desc;

大資料之Hive DML資料操作 一

1.資料匯入 增 1 1.向表中裝載資料 load 0 建立一張表 hive default create table student id string,name string row format delimited fields terminated by t 1 載入本地檔案到hive hi...

大資料之Hive DML資料操作 二

資料匯入 增 3.查詢語句中建立表並載入資料 as select create table if not exists student3 as select id,name from student 4.建立表時通過location指定載入資料路徑 1 上傳資料到hdfs上 hive default...

大資料之Hive DML資料操作 四

1.查詢 查 1 1.全表查詢 hive default select from emp 1 2.選擇特定列查詢 hive default select empno,ename from emp 2.刪除和更改 刪除delete from stu where id 1 修改 update stu s...