Foo說Bar道 HashMap篇之hash

hashmap是廣大程式設計師在做專案的時候，最喜歡使用的乙個工具，用的最多但了解的並不與使用頻率成正比，很多人都是只停留在會put/get而已。這樣在面試的時候其實很不吃香的，知道面試會問hashmap就去網上看面經，但麵經上的關於hashmap的東西嘛。。。千篇一律，看完之後食之無味棄之可惜。所以去看原始碼是乙個了解hashmap很好的方式也是很重要的途徑。這篇文章不會涉及太多hashmap原始碼的東西，我主要拿來其中的一點與大家進行分享——雜湊方法static final int hash(object key)；

static
final
int hash(object key)

看上去，沒啥太複雜的東西，就是拿來k的hashcode，高低16位做亦或，在後續進行模擬取模操作。

那麼問題來了，你真的知道他為什麼要高低16位亦或嗎？或許你會跟我說，人家網上不是都說了，為了讓hash做的更均勻，盡量避免衝突嗎？那我們就來做乙個實驗，看一看這個東西到底是不是像網上說的那樣：

實驗步驟很簡單，我們隨便敲一些字串：

list( "asf","132sg","23ga","13erasd","alireio", "2oosoi","qooizoi","!#@$sdgta","asd123zadsf#@","qasdolkado!#@", "} ，另一方面取出m個a，後n位衝突的概率是 1-2^n!/((2^n-m)! * 2^) 就是說網上說的什麼hash函式為了解決hashcode後n位相等的情況，到**查都是這個答案，那麼我想問你們想過沒有，乙個整數字操作後得到的，難道不也是乙個整數嗎？難道他就不會出現相等的情況嗎？所以對這類人我不做過多評價。所以這麼看來hash函式其實根本沒有降低衝突率，衝突率降低的唯一方法是降低 m/n 的值，熟悉嗎？這不就是hashmap的額定大小和負載因子幹的活嗎？那麼問題來了，那這個hash存在的意義又是什麼呢？？？我思考了許久，發現了乙個事情，就是說上面的推論的大前提是：任意整數！也就是說前提是說key的hashcode足夠均勻！那麼這個時候，我們是否應該把關注點放在hashcode身上了？如果hashcode足夠均勻，那麼hash函式自然就起不到作用，那如果他不是足夠均勻的呢？根據這個入手點，我最後得出乙個結論，這個高低十六位亦或的操作，是基於假設key類的設計者在設計hashcode的時候可能設計出bad hashcode，在設計這個bad hashcode的時候bad的點可能在於hashcode的後n位不均勻，而不是bad在hashcode的高低16位亦或後的後n位不均勻！這就是跳了一層的感覺。可能比較繞口，我們來舉個栗子說明一下。對於乙個類，我們如果想重寫hashcode，一般會根據某個字段某個屬性，按照一定的公式，去計算吧？那麼這個計算的出的結果，很可能遵循著某個線性的規律，這個規律導致了物件的hashcode的後n為可能比較集中。那麼，對於高低16位亦或來說就不一樣了，我總不能特意去設計乙個hashcode經過高低16位亦或的結果比較集中的hash吧？比如？像下面這種？

int hashcode()

那我估計這樣的類作為key的話，hashmap的設計者可能會跑出來殺了你的

Foo說Bar道 HashMap篇之hash

HashMap的一道簡單例子

P說多執行緒HashMap產生死迴圈

從一道演算法題說去1

Foo說Bar道 HashMap篇之hash

HashMap的一道簡單例子

P說 多執行緒HashMap產生死迴圈

從一道演算法題說去1

相關推薦

P說多執行緒HashMap產生死迴圈