mysql 雜湊索引 MySQL索引之雜湊索引

2021-10-17 15:08:17 字數 1692 閱讀 7512

雜湊索引(hash

index)建立在雜湊表的基礎上,它只對使用了索引中的每一列的精確查詢有用。對於每一行,儲存引擎計算出了被索引的雜湊碼(hash

code),它是乙個較小的值,並且有可能和其他行的雜湊碼不同。它把雜湊碼儲存在索引中,並且儲存了乙個指向雜湊表中的每一行的指標。

在mysql中,只有memory儲存引擎支援顯式的雜湊索引。如果多個值有相同的雜湊碼,索引就會把行指標以鍊錶的方式儲存在雜湊表的同一條記錄中。

雜湊索引的細節還有很多,由於myisam和innodb並不支援,所以在這裡不詳解。

下面著力講解建立自己的mysql雜湊索引

想法非常簡單,在標準的b-tree索引上建立乙個偽雜湊索引。它和真正的雜湊索引不是一回事,因為它還是使用b-tree索引進行查詢。然而,它將會使用鍵的雜湊值進行查詢,而不是鍵自身。你所要做的事情就是在where子句中手動地定義雜湊函式。

例子:url查詢。

url通常會導致b-tree索引變大,因為它們非常長。通常會按照下面的方式來查詢url表。

mysql>select id from url where url='';

但是,如果移除掉url列上的索引並且給表新增乙個被索引的url_src列,就可以按照下面的方式進行查詢:

mysql>select id from url where url='' and url_src=crc32('');

mysql查詢優化器注意到url_src列上有很小的,選擇性很高的索引,並且它會使用裡面的值進行索引查詢。即使有幾列相同的url_src值,也很容易進行精確的對比來確定需要的行。替代方案是把完整的url索引為字串,它要慢很多。

這個辦法的乙個缺點就是要維護雜湊值。你可以手工進行維護,在mysql5.0 以上版本中,可以使用觸發器來進行維護。

1.建立乙個表:

create table pseudohash(

idintunsignednotnullauto_increment,

urlvarchar(255)notnull,

url_srcintunsigned noitnulldefault0,

primarykey(id)

接下來建立觸發器。我們先暫時更新一下命令分隔符,這樣就可以在觸發器中使用分號:

delimiter |

createtriggerpseudohash_src_ins beforeinsertonpseudohashforeach rowbeginsetnew.url_src = crc32(new.url);

end;

createtriggerpseudohash_src_upd beforeupdateonpseudohashforeach rowbeginsetnew.url_src = crc32(new.url);

end;

delimiter;

剩下的工作就是驗證觸發器自動維護了雜湊值。

如果使用這種方式,就不應該使用sha1()和md5()這此雜湊函式。它們返回很長的字串,會浪費大量的儲存空間並且減慢比較速度。它們是強加

密函式,被設計為不產生任務衝突。這並不是我們的目標。簡單的雜湊函式能在有較好效能的同時保證可接受的衝突率。當然,如果表有很多行並且crc32()

產生了很多衝突,就要實現自己的64位雜湊函式,要確保自己的函式返回整數,而不是字串。

mysql>select conv(right(md5('/'),16),16,10) as hash64;

mysql雜湊索引用途 MySQL 雜湊索引

雜湊索引基於雜湊表實現,只有精確匹配索引所有列的查詢才有效。在mysql中只有memory引擎顯示支援雜湊索引,也是memory引擎表的預設索引型別。memory引擎是支援非唯一雜湊索引的。如果多個列的雜湊值相同,索引會以鍊錶 的方式存放多個記錄指標道同乙個雜湊條目中。舉個粒子 create tab...

mysql主鍵索引 MySQL索引之主鍵索引

在mysql裡,主鍵索引和輔助索引分別是什麼意思,有什麼區別?上次的分享我們介紹了聚集索引和非聚集索引的區別,本次我們繼續介紹主鍵索引和輔助索引的區別。1 主鍵索引 主鍵索引,簡稱主鍵,原文是primary key,由乙個或多個列組成,用於唯一性標識資料表中的某一條記錄。乙個表可以沒有主鍵,但最多只...

mysql聚集索引 MySQL索引之聚集索引介紹

在mysql裡,聚集索引和非聚集索引分別是什麼意思,有什麼區別?在mysql中,innodb引擎表是 聚集 索引組織表 clustered index organize table 而myisam引擎表則是堆組織表 heap organize table 也有人把聚集索引稱為聚簇索引。當然了,聚集索...