如何解決雜湊衝突

2021-07-12 05:37:38 字數 2582 閱讀 2693

就不自己寫了,直接貼下吧

看了concurrenthashmap的實現, 使用的是拉鍊法.

雖然我們不希望發生衝突,但實際上發生衝突的可能性仍是存在的。當關鍵字值域遠大於雜湊表的長度,而且事先並不知道關鍵字的具體取值時。衝突就難免會發 生。另外,當關鍵字的實際取值大於雜湊表的長度時,而且表中已裝滿了記錄,如果插入乙個新記錄,不僅發生衝突,而且還會發生溢位。因此,處理衝突和溢位是 雜湊技術中的兩個重要問題。

1、開放定址法

用開放定址法解決衝突的做法是:當衝突發生時,使用某種探查(亦稱探測)技術在雜湊表中形成乙個探查(測)序列。沿此序列逐個單元地查詢,直到找到給定 的關鍵字,或者碰到乙個開放的位址(即該位址單元為空)為止(若要插入,在探查到開放的位址,則可將待插入的新結點存人該位址單元)。查詢時探查到開放的 位址則表明表中無待查的關鍵字,即查詢失敗。

注意:

①用開放定址法建立雜湊表時,建表前須將表中所有單元(更嚴格地說,是指單元中儲存的關鍵字)置空。

②空單元的表示與具體的應用相關。

按照形成探查序列的方法不同,可將開放定址法區分為線性探查法、線性補償探測法、隨機探測等。

(1)線性探查法(linear probing)

該方法的基本思想是:

將雜湊表t[0..m-1]看成是乙個迴圈向量,若初始探查的位址為d(即h(key)=d),則最長的探查序列為:

d,d+l,d+2,…,m-1,0,1,…,d-1

即:探查時從位址d開始,首先探查t[d],然後依次探查t[d+1],…,直到t[m-1],此後又迴圈到t[0],t[1],…,直到探查到t[d-1]為止。

探查過程終止於三種情況:

(1)若當前探查的單元為空,則表示查詢失敗(若是插入則將key寫入其中);

(2)若當前探查的單元中含有key,則查詢成功,但對於插入意味著失敗;

(3)若探查到t[d-1]時仍未發現空單元也未找到key,則無論是查詢還是插入均意味著失敗(此時表滿)。

利用開放位址法的一般形式,線性探查法的探查序列為:

hi=(h(key)+i)%m 0≤i≤m-1 //即di=i

用線性探測法處理衝突,思路清晰,演算法簡單,但存在下列缺點:

① 處理溢位需另程式設計序。一般可另外設立乙個溢位表,專門用來存放上述雜湊表中放不下的記錄。此溢位表最簡單的結構是順序表,查詢方法可用順序查詢。

② 按上述演算法建立起來的雜湊表,刪除工作非常困難。假如要從雜湊表 ht 中刪除乙個記錄,按理應將這個記錄所在位置置為空,但我們不能這樣做,而只能標上已被刪除的標記,否則,將會影響以後的查詢。

③ 線性探測法很容易產生堆聚現象。所謂堆聚現象,就是存入雜湊表的記錄在表中連成一片。按照線性探測法處理衝突,如果生成雜湊位址的連續序列愈長 ( 即不同關鍵字值的雜湊位址相鄰在一起愈長 ) ,則當新的記錄加入該錶時,與這個序列發生衝突的可能性愈大。因此,雜湊位址的較長連續序列比較短連續序列生長得快,這就意味著,一旦出現堆聚 ( 伴隨著衝突 ) ,就將引起進一步的堆聚。

(2)線性補償探測法

線性補償探測法的基本思想是:

將線性探測的步長從 1 改為 q ,即將上述演算法中的 j = (j + 1) % m 改為: j = (j + q) % m ,而且要求 q 與 m 是互質的,以便能探測到雜湊表中的所有單元。

【例】 pdp-11 小型計算機中的匯程式設計序所用的符合表,就採用此方法來解決衝突,所用表長 m = 1321 ,選用 q = 25 。

(3)隨機探測

2、拉鍊法

(1)拉鍊法解決衝突的方法

拉鍊法解決衝突的做法是:將所有關鍵字為同義詞的結點鏈結在同乙個單鏈表中。若選定的雜湊表長度為m,則可將雜湊表定義為乙個由m個頭指標組成的指標數 組t[0..m-1]。凡是雜湊位址為i的結點,均插入到以t[i]為頭指標的單鏈表中。t中各分量的初值均應為空指標。在拉鍊法中,裝填因子α可以大於 1,但一般均取α≤1。

【例】設有 m = 5 , h(k) = k mod 5 ,關鍵字值序例 5 , 21 , 17 , 9 , 15 , 36 , 41 , 24 ,按外鏈位址法所建立的雜湊表如下圖所示:

(2)拉鍊法的優點

與開放定址法相比,拉鍊法有如下幾個優點:

①拉鍊法處理衝突簡單,且無堆積現象,即非同義詞決不會發生衝突,因此平均查詢長度較短;

②由於拉鍊法中各煉表上的結點空間是動態申請的,故它更適合於造表前無法確定表長的情況;

③開放定址法為減少衝突,要求裝填因子α較小,故當結點規模較大時會浪費很多空間。而拉鍊法中可取α≥1,且結點較大時,拉鍊法中增加的指標域可忽略不計,因此節省空間;

④在用拉鍊法構造的雜湊表中,刪除結點的操作易於實現。只要簡單地刪去鍊錶上相應的結點即可。而對開放位址法構造的雜湊表,刪除結點不能簡單地將被刪結 點的空間置為空,否則將截斷在它之後填人雜湊表的同義詞結點的查詢路徑。這是因為各種開放位址法中,空位址單元(即開放位址)都是查詢失敗的條件。因此在 用開放位址法處理衝突的雜湊表上執行刪除操作,只能在被刪結點上做刪除標記,而不能真正刪除結點。

(3)拉鍊法的缺點

拉鍊法的缺點是:指標需要額外的空間,故當結點規模較小時,開放定址法較為節省空間,而若將節省的指標空間用來擴大雜湊表的規模,可使裝填因子變小,這又減少了開放定址法中的衝突,從而提高平均查詢速度。

svn 如何解決衝突

專案中,往往不止你一人開發,多人開發,難免會有 的衝突。彼此間誰也不能保證不會修改同個檔案。如果修改了同個方法的內容。這時提交到svn是會提示 衝突的。當然,衝突是可控的,但不能避免。每次寫 的時候,標準的姿勢是先update,再修改提交。下面,我們說下衝突後該如何解決?檔案衝突格式如下 code ...

Tortoise Git 如何解決衝突

本地 沒有及時更新,提交 的時候出現衝突。pull 拉取 即更新 右鍵滑鼠,選擇tortoisegit t 選擇拉取 或者 pull即可 手動編輯檔案,以解決衝突 開啟衝突檔案,如圖所示,衝突標誌 head 和 之間的 是本地 本地倉庫 等號和下邊的 版本號 之間是遠端倉庫的 你需要編輯後留下你需要...

如何解決Hash衝突

雜湊衝突相關介紹 雜湊計算時努力把比較大的資料存放到相對較小的空間 最常見的雜湊演算法是取模法 取模法的計算過程 比如陣列的長度是5,這是有乙個資料是6,那麼如何把這個6存放到長度只是5的資料中呢,安裝取模法,計算6 5,結果是1,那麼就把6放到資料下標是1的位置,那麼7就應該放在2這個位置,到此位...