HBase資料匯出到HDFS

2021-08-09 02:30:47 字數 4064 閱讀 7040

一、目的

把hbase中某張表的資料匯出到hdfs上乙份。

實現方式這裡介紹兩種:一種是自己寫mr程式來完成,一種是使用hbase提供的類來完成。

二、自定義mr程式將hbase資料匯出到hdfs上

2.1首先看看hbase中t1表中的資料:

2.2mr的**如下:

比較重要的語句是

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

21

22

23

24

25

26

27

28

29

30

31

32

33

34

35

36

37

38

39

40

41

42

43

44

45

46

47

48

49

50

51

52

53

publicclasshbasetohdfs

publicstaticclassextends

privatetext outkey =newtext();

privatetext outvalue =newtext();

@override

protectedvoidmap(immutablebyteswritable key, result value, context context)throwsioexception, interruptedexceptioncatch(exception e) {}

trycatch(exception e) {}

trycatch(exception e) {}

trycatch(exception e) {}

outkey.set(key.get());

string temp = ((name==null|| name.length==0)?"null":newstring(name)) +"\t"+ ((age==null|| age.length==0)?"null":newstring(age)) +"\t"+ ((gender==null||gender.length==0)?"null":newstring(gender)) +"\t"+  ((birthday==null||birthday.length==0)?"null":newstring(birthday));

system.out.println(temp);

outvalue.set(temp);

context.write(outkey, outvalue);

}

}

}

2.3打包執行

hadoop jar hbasetodfs.jar com.lanyun.hadoop2.hbasetohdfs t1 /t1

2.4檢視hdfs上的檔案

(my_python_env)[root@hadoop26 ~]# hadoop fs -cat /t1/part*

1 zhangsan 10

male null

2lisi null null null

3wangwu null null null

4 zhaoliu null null 1993

至此,匯出成功

三、使用hbase自帶的工具進行匯出

hbase自帶的工具是:org.apache.hadoop.hbase.mapreduce.export

3.1如何使用這個工具呢?檢視幫助資訊

(my_python_env)[root@hadoop26 ~]# hbase org.apache.hadoop.hbase.mapreduce.export

error: wrong number of arguments:

0usage: export [-d ]* [ [^[regex pattern] or [prefix] to filter]]

3.2使用工具來匯出

hbase org.apache.hadoop.hbase.mapreduce.export t1 /t2

至此已經完成匯出。

hive查詢資料匯出到本地目錄或hdfs的方法

一 匯出到本地檔案系統 hive insert overwrite local directory home mydir mydir select from test 二 匯出到hdfs中 hive insert overwrite directory home mydir mydir select...

HIVE中的資料怎麼匯出到hdfs或本地呢

在我不知道工具 也不熟悉hiql語法的情況下,沒辦法了,只有選擇乙個最簡單粗暴的方法,重定向。在shell中使用 hive e 可以在shell中執行hive命令,hive f可以執行檔案之中的sql語句,需要什麼資料,就把它查詢出來,最後重定向到指定目錄之下。在hive中使用insert over...

資料匯出到excel

一 加上表頭後變成亂碼 要匯出的datatable 型別 excel的檔名 匯出的檔案中不帶表頭 二 使用wps開啟正常 匯出到excel 已經實現效果 資料表 檔名 列名 需要查詢幾列 else else resp.write ls item resp.write resp.end 三 目前用著感...