HBase分享系列(3) 讀取細節

2021-07-04 08:04:41 字數 511 閱讀 6313

一、布隆過濾器

1、檢索機制

2、優點

(1)節省儲存空間

(2)節省定位時間

3、缺點

(1)有誤差

(2)有刪除困難

布隆過濾可以每列族單獨啟用。

使用 hcolumndescriptor.setbloomfiltertype(none | row | rowcol) 對列族單獨啟用布隆。

default = none 沒有布隆過濾。

對 row,行鍵的雜湊在每次插入行時將被新增到布隆。

對 rowcol,行鍵 + 列族 + 列族修飾的雜湊將在每次插入行時新增到布隆。

二、效能相關

1、建表時預先建立region

2、關閉客戶端寫入自動重新整理

3、不需要返回結果

4、多執行緒寫入

5、設定乙個版本

6、新增行級bloomfilter

7、使用查詢過濾器

8、設定讀快取

Hbase讀流程詳解

關鍵元件 讀快取block cache 磁碟讀的資料 memstore hstore 定位操作和寫流程中的一致關鍵字zk meta region server meta表所在位置 meta表結構 根據table和row key所在範圍 定位region 讀操作 記憶體 磁碟 一起都讀 讀完後要合併m...

HBase分享會議筆記

今天參加了乙個關於hbase的分享,有一些內容是之前的知識的補充。之前關於hadoop家族,包括hbase的內容,可以參考 hbase是三維儲存和索引 hbase所謂的三維有序儲存的三維是指 rowkey 行主鍵 column key columnfamily qualifier timestamp...

技術分享 Hbase儲存模式

hbase本身是資料庫,本身就是為了儲存資料,因此了解其儲存原理對我們是很有必要的,這樣我們才能更好的使用hbase。首先才能儲存模式開始,hbase的儲存模式與傳統型的儲存模式有什麼區別。列式儲存 columnar or column based 是相對於傳統關係型資料庫的行式儲存 row bas...