Hbase 統計行數的四種方式

2022-03-18 23:35:32 字數 1076 閱讀 6116

1.shell中執行count的命令:

count 『t1′, interval => 10, cache => 1000     

interval為統計的行數間隔,預設為1000,cache為統計的資料快取。這種方式效率很低,如果錶行數很大的話不建議採用這種方式。

2.hbase自帶 mapreduce 工具類:

shell 中執行 :$hbase_home/bin/hbase   org.apache.hadoop.hbase.mapreduce.rowcounter 『tablename』

3.使用 coprocessor 新特性:

configuration conf =hbaseconfiguration.create();

htable htable = new htable(conf, tablename.valueof("t_review_module"));

longcolumninterpreter columninterpreter = new

longcolumninterpreter();

aggregationclient aggregationclient = new

aggregationclient(conf);

scan scan = new

scan( bytes.tobytes("2018-07-01 12:12:12"), bytes.tobytes("2018-07-27 12:12:12"));

long

count = aggregationclient.rowcount(htable, columninterpreter, scan);

4.hive over hbase:用hive的語句建立hbase的關聯表,可以直接在hive中執行sql語句統計hbase表的行數。建立關聯表的語句:

create table hive_hbase_1(key int,value string)  

tblproperties("hbase.table.name"="t_hive","hbase.table.default.storage.type"="binary");

Hbase 統計表行數的3種方式

有些時候需要我們去統計某乙個hbase表的行數,由於hbase本身不支援sql語言,只能通過其他方式實現。可以通過一下幾種方式實現hbase表的行數統計工作 1.count命令 最直接的方式是在hbase shell中執行count的命令可以統計行數。hbase count t1 hbase cou...

Hbase 統計表行數的3種方式總結

有些時候需要我們去統計某乙個hbase表的行數,由於hbase本身不支援sql語言,只能通過其他方式實現。可以通過一下幾種方式實現hbase表的行數統計工作 1 count命令 最直接的方式是在hbase shell中執行count的命令可以統計行數。hbase count t1 hbase cou...

Hbase 統計表行數的3種方式總結

有些時候需要我們去統計某乙個hbase表的行數,由於hbase本身不支援sql語言,只能通過其他方式實現。可以通過一下幾種方式實現hbase表的行數統計工作 1.count命令 最直接的方式是在hbase shell中執行count的命令可以統計行數。html view plain copy hba...