Hbase學習筆記

2021-06-19 16:27:36 字數 802 閱讀 3213

1.table中行是按照row key的字典序排列的

2.在行的方向上分隔為多個region

3.hregion是hbase 中分布式儲存和負載均衡的最小單位,這表示不同的region可以分布在不同的regionserver上

當乙個region足夠大時,(現在是256m),就會split,乙個region會拆分為2個。  

4.每個region由乙個或多個store組成,每個store儲存了乙個columnfamily,每個store包含乙個memstore、 0或者多個storefile;當storefile足夠大時,會compact

當寫入資料時,會先寫入hlog中,再寫入memstore,如果memstore的大小已經足夠大,就會flush,把資料儲存到storefile中;

當讀資料時,會先從memstore中讀取,如果沒有才會找storefile。storefile以hfile格式儲存在hdfs上。

meta 儲存了region的資訊

root 儲存了meta的資訊

每個regionserver維護乙個hlog

好處:寫操作方便

缺點:如果該regionserver下線,恢復資料時,需要把該台region server上的資料分發到多個region上。

sequence file 的key是hlogkey物件,hlogkey中記錄了寫入資料的歸屬資訊,除了table和region名字外,同時還包括 sequence number和timestamp,timestamp是」寫入時間」,sequence number的起始值為0,或者是最近一次存入檔案系統中sequence number。

Hbase 學習筆記 Hbase 概覽

hbase構建在 hdfs 之上,hbase內部管理的檔案全部儲存在hdfs 中 行鍵,table的主鍵,table中的記錄按照row key排序。型別為byte array 列簇,table在水平方向有乙個或者多個column family組成,乙個column family中可以由任意多個col...

HBase學習筆記

hbase簡介 1 hbase定義 hbase是一種分布式 面向列的開源資料庫。具有良好的擴充套件性 低寫入 查詢延遲的特點。2 hbase與傳統的關聯式資料庫的區別 hbase rdb 資料型別 簡單的,儲存為未經解釋的字串 豐富的資料型別和儲存方式 資料操作 只有簡單的插入 查詢 刪除和清空等 ...

HBase 學習筆記

1.hbase是乙個高可靠 高效能 面向列 可伸縮的構建在hdfs上的分布式資料庫 2.hbase通過行鍵 列族 列限定符 時間戳來確定乙個單元格 3.傳統行式儲存用於處理事務性操作,列式儲存主要用於資料分析型業務 4.乙個hbase表會被分成多個regin,同乙個regin不會被到多個regin伺...