使用importTsv完成HBase 的資料遷移

使用hbase put api：例如mapreduce也是使用put api

使用hbase批量載入工具

自定義的mapreduce job

這三種方式都涉及到put內建,大多數資料遷移場景都涉及到資料的匯入(import)，從存在的rdbms匯入到hbase中去，大多數簡單直接的方法是直接獲取資料,使用單執行緒，這種效果非常慢，其實可以寫多執行緒完成。

同時importtsv是hbase提供的乙個命令列工具，可以將儲存在hdfs上的自定義分隔符（預設\t）的資料檔案，通過一條命令方便的匯入到hbase表中，對於大資料量匯入非常實用

以下將介紹如何使用importtsv.

通過以下步驟可以將乙個tsv檔案的資料匯入到hbase的**中

export hbase_home=/opt/sofewares /hbase/hbase-0.98.6-hadoop2 export hadoop_home=/opt/cdh5.3.6/hadoop-2.5.0-cdh5.3.6 hadoop_classpath=`$/bin/hbase mapredcp` $/bin/hadoop jar $hbase_home/lib/hbase-server-0.98.6-hadoop2.jar importtsv \ -dimporttsv.columns=hbase_row_key,info:name,info:age,info:***,info:address,info:phone student hdfs: /beifeng/hbase /importtsv

使用importTsv完成HBase 的資料遷移

importtsv工具匯入文字檔案到Hbase

使用importtsv命令載入資料

使用DataX從CSV中讀取檔案存入HBase

使用importTsv完成HBase 的資料遷移

importtsv工具匯入文字檔案到Hbase

使用importtsv命令載入資料

使用DataX從CSV中讀取檔案存入HBase

相關推薦