Hive程式設計指南07 索引

2021-07-28 02:34:05 字數 1141 閱讀 2422

hive索引

建立索引

create index tablename_index

on table (col1)

as 'org.apache.hadoop.hive.ql.index.compact.compactindexhandler'

with deferred rebuild

idxproperties('creator' = 'me', 'created_at' = 'some_time')

in table tablename_index_table//要求索引處理器在一張新錶中保留索引資料

partitioned by (col1, col2)

comment '...';

bitmap索引

應用於排重後值較少的列

create index tablename_index

on  table (col1)

as 'bitmap'

with deferred rebuild

idxproperties('creator' = 'me', 'created_at' = 'some_time')

in table tablename_index_table

partitioned by (col1, col2)

comment '...';

重建索引

alter index tablename_index

on  table

partition (col1 = '')

rebuild;

顯示索引

show formatted index on ;

//formatted,可以使輸出中包含有列名稱;indexs可以列舉出多個索引資訊

刪除索引

drop index if exists tablename_index on table ;

//如果有索引表,刪除乙個索引將會刪除這個索引表

//如果被索引的表被刪除,其對應的索引和索引表也會被刪除;原始表的某個分割槽被刪除,其對應的分割槽索引也會被刪除

《Hive程式設計指南》之Hive環境安裝

hive 1 解壓 2 配置 hadoop home hive home等環境變數 3 修改配置檔案hive conf cp hive default.xml.template hive site.xml 修改hive.metastore.schema.verification的值為false 建立...

Hive程式設計指南 學習筆記01

第四章 hql的資料定義 1 建立資料庫 create database financials create database if not exists financials 2 檢視資料庫 show databases 模糊查詢資料庫 show databases like h.3 建立資料庫修...

Hive程式設計指南 要點總結(1)

1.當對3個或更多的表進行join連線時,若是on子句都是使用相同的連線鍵的話,那麼只會產生乙個mapreduce任務。2.使用者在進行多表查詢時,需要保證連續查詢的表的大小從左至右是依次增大的。因為hive假定查詢中最後乙個表是最大的表,在對每行記錄進行連線操作時,它會嘗試將其他表快取起來,然後掃...