Hbase概述以及快速入門

2021-10-08 05:40:21 字數 3386 閱讀 2496

1.3 hbase架構

二 hbase快速入門

2.2hbase shell操作

hbase是一種分布式、可擴充套件、支援海量資料儲存的nosql資料庫

邏輯上,hbase的資料模型與關係型資料庫很類似,資料儲存在一張表中,有行有列。但從底層物理儲存結構(k-v)來看,hbase更像是乙個多維度的map。

命名空間,類似於關係型資料庫的database概念,每個命名空間下有多個表。hbase有兩個自帶的命名空間,分別是「hbase」和「default」,「hbase」中存放的是hbase內建的表,「default」表是使用者預設使用的命名空間。

2)region

類似於關係型資料庫的表概念。不同的是,hbase定義表時只需要宣告列族即可,不需要宣告具體的列。這意味著,往hbase寫入資料時,字段可以動態、按需指定。因此,和關係型資料庫相比,hbase能夠輕鬆應對字段變更的場景。

3)row

hbase表中的每行資料都由乙個rowkey和多個column(列)組成,資料是按照rowkey的字典順序儲存的,並且查詢資料時只能根據rowkey進行檢索,所以rowkey的設計十分重要。

4)column

hbase中的每個列都由**column family(列族)column qualifier(列限定符)**進行限定,例如info:name,info:age。建表時,只需指明列族,而列限定符無需預先定義。

5)time stamp

用於標識資料的不同版本(version),每條資料寫入時,如果不指定時間戳,系統會自動為其加上該欄位,其值為寫入hbase的時間。

6)cell

由 唯一確定的單元。

cell中的資料是沒有型別的,全部是位元組碼形式儲存。

2)配置環境變數

3)修改hbase對應的配置檔案

​ hbase-env.sh修改內容

export hbase_manages_zk=false
​ hbase-site.xml

>

>

hbase.rootdirname

>

>

hdfs://hadoop102:8020/hbasevalue

>

property

>

>

>

hbase.cluster.distributedname

>

>

truevalue

>

property

>

>

>

hbase.zookeeper.quorumname

>

>

hadoop102,hadoop103,hadoop104value

>

property

>

​ regionservers

ip1

ip2ip3

start-hbase.sh

stop-hbase.sh

①同步時間服務

②屬性:hbase.master.maxclockskew設定更大的值

>

>

hbase.master.maxclockskewname

>

>

180000value

>

>

time difference of regionserver from masterdescription

>

property

>

乙個hmaster如果掛掉可能會導致整個hbase掛掉,此時配置高可用就是可以在主hmaster掛掉之後,備用hmaster會快速補上

在hbase的解壓檔案下的conf目錄下新建乙個問價backup-master(名字必須一樣不然不能識別),在裡面新增需要的備用hmaster即可

1、建立命名空間

create_namespace 命名空間名稱

2、建立表

create 表名,列簇1名,列簇2名,.

3、修改表結構

新增列簇:alter 表名,

修改列簇;alter 表名,name=>待修改的列簇名,version=>版本號

4、插入資料

put 『命名空間:表名』,『rowkey』,『列簇名:列限定符』,『值』

5、修改資料與插入一樣

6、刪除資料

1、刪除cell資料: delete 『命名空間:表名』,『rowkey』,『列簇名:列限定符』

2、刪除正行: deleteall 『命名空間:表名』,『rowkey』

7、刪除表:

1、禁用表; disable 『命名空間:表名』

2、刪除: drop 『命名空間:表名』

8、清空表資料

truncate 『命名空間:表名』

9、統計表行數

count 『命名空間:表名』

10、刪除命名空間

drop_namespace 『命名空間』 [命名空間中沒有表才能刪除]

11、查詢資料

1、根據rowkey查詢:

1、查詢正行:get 『命名空間:表名』,『rowkey』

2、查詢某個列簇的資料: get 『命名空間:表名』,『rowkey』,『列簇名』

3、查詢某個列: get 『命名空間:表名』,『rowkey』,『列簇名:列限定符』

2、掃瞄資料

1、查詢整表資料:scan 『命名空間:表名』

2、查詢列簇的資料: scan 『命名空間:表名』,

2、查詢列的資料: scan 『命名空間:表名』,

12、查詢所有表: list

13、查詢所有命名空間: list_namespace

14、查詢表結構資訊;describe 『命名空間:表名』

hbase快速入門之 系統架構

使用hbase 的rpc 機制與hmaster 和hregionserver 進行通訊,對於管理類操作,client 與hmaster 進行rpc 對於資料讀寫類操作,client 與hregionserver 進行rpc zookeeper zookeeper quorum 中除了儲存了 root...

Hbase 入門簡介

hbase是apache hadoop中的乙個子專案,hbase依託於hadoop的hdfs作為最基本儲存基礎單元,通過使用hadoop的dfs工具就可以看到這些這些資料 儲存資料夾的結構,還可以通過map reduce的框架 演算法 對hbase進行操作,如下圖所示 hbase在產品中還包含了je...

hbase 命令入門

1.建立表 create student name address 新建student表,該錶有兩列 名稱和位址,名稱只有乙個,address可以有多個,create dirktest 2.插入一條記錄,只能插入某列 put student 1 name tom 向student有中插入記錄,記錄的...