HBase筆記 3 過濾器

2021-08-02 22:44:35 字數 2030 閱讀 1239

less

匹配小於設定值的值

less_or_equal

匹配小於或等於設定值的值

equal

匹配等於設定值的值

not_equal

匹配大於設定值不相同的值

greater_or_equal

匹配大於或等於設定值的值

greater

匹配大於設定值的值

not_op

排除一切值

binarycomparator

使用bytes.compareto()比較當前值與閾值

binaryprefixcomparator

與上面的相似,使用bytes.compareto()進行匹配,但是是從左端開始字首匹配

nullcomparator

不做匹配,只判斷當前值是不是null

bitcomparator

通過bitwiseop類提供的按位與(and),或(or),異或(xor)操作執行位級比較

regexstringcomparator

根據乙個正規表示式,在例項化這個比較器的時候去匹配表中資料

substringcomparator

把閾值和表中資料當做string例項,同時通過contains()操作匹配字串

rowfilter(行過濾器)行過濾器是基於行鍵來過濾資料

familyfilter(列族過濾器)列族過濾器是基於列族來進行過濾資料

qualifierfilter(列名過濾器)列名過濾器使用者篩選特定的列

valuefilter(值過濾器)值過濾器使用者篩選某個特定值的單元格。與regexstringcomparator配合使用,可以使用功能強大的表示式來進行篩選。

dependentcolumnfilter(參考列過濾器)參考列過濾器不僅僅簡單的通過使用者指定的資訊篩選資料,還允許使用者指定乙個參考列或是引用列。並使用參考列控制其他列的過濾。

singlecolumnvaluefilter(專用過濾器)用一列的值決定是否一行資料是否被過濾

singlecolumnvalueexcludefilter(單列排除過濾器)該過濾器繼承singlecolumnvaluefilter,作為篩選條件的列的不會包含在返回的結果中。

prefixfilter(字首過濾器)篩選出具有特點字首的行鍵的資料。掃瞄操作以字典序查詢,當遇到比字首大的行時,掃瞄結束。prefixfilter對get()方法作用不大。字首過濾器只針對行鍵。

pagefilter(分頁過濾器)可以使用這個過濾器對結果按行分頁。當使用者建立pagefilter的例項的時候,指定了pagesize,這個引數可以控制每頁返回的行數。

keyonlyfilter(行鍵過濾器)只返回每行的行鍵,不返回值。對於之關注於行鍵的應用常見來說非常合適,不返回值,可以減少傳遞到客戶端的資料量,能起到一定的優化作用。

firstkeyonlyfilter(首次行鍵過濾器)只想返回的結果集中只包含第一列的資料

inclusivestopfilter(包含結束的過濾器)開始行被包含在結果中,單終止行被排除在外,使用這個過濾器,也可以將結束行包含在結果中。

timestampfilter(時間戳過濾器)使用時間戳過濾器可以對掃瞄結果中對版本進行細粒度的控制。

columncountgetfilter(列計數過濾器)確定每行最多返回多少列,並在遇到一定的列數超過我們鎖設定的限制值的時候,結束掃瞄操作

columnpaginationfilter(列分頁過濾器)與pagefilter類似,列分頁過濾器可以對一行的所有列進行分頁。

columnprefixfilter(列字首過濾器)類似prefixfilter,列字首過濾器通過對列名進行字首匹配過濾

randomrowfilter(隨機行過濾器)隨機行過濾器可以讓結果中包含隨機行。

skipfilter(跳轉過濾器)與valuefilter結合使用,如果發現一行中的某一列不符合條件,那麼整行都會被過濾掉。

whilematchfilter(全匹配過濾器)如果你想想要在遇到某種條件資料之前的資料時,就可以使用這個過濾器,當遇到不符合設定條件的資料的時候,整個掃瞄也結束了。

hbase 過濾器 scala 過濾器系列

過濾器系列710 c30810 賓士 c64 1500 004 09411 04 004094 3504 h12 110 2 w11102 2 wdk724 wdk725 沃爾沃 3825778 8149064 3825133 3825215 466634 11110668 11711074 477...

HBase(七)Hbase過濾器

基礎api中的查詢操作在面對大量資料的時候是非常蒼白的,這裡hbase提供了高階的查詢方法 filter。filter可以根據簇 列 版本等更多的條件來對資料進行過濾,基於hbase本身提供的三維有序 主鍵有序 列有序 版本有序 這些filter可以高效的完成查詢過濾的任務。帶有filter條件的r...

HBase之過濾器

過濾器的型別很多,但是可以分為兩大類 比較過濾器,專用過濾器 過濾器的作用是在服務端判斷資料是否滿足條件,然後只將滿足條件的資料返回給客戶端 hbase 的基本 api,包括增 刪 改 查等。增 刪都是相對簡單的操作,與傳統的 rdbms 相比,這裡的查詢操作略顯蒼白,只能根據特性的行鍵進行查詢 g...