校驗和演算法

2021-07-11 00:00:51 字數 2706 閱讀 9094

校驗和演算法

經常看計算機網路相關的書時,每次看到關於ip或者是udp報頭校驗和時,都是一笑而過,以為相當簡單的東西,不就是16bit資料的相加嗎!最近在學習ping命令的源待時,看到裡面有關於校驗和的演算法。一頭霧水,後來查詢資料,看到校驗和是16bit字的二進位制反碼和。總是覺得很奇怪,為什麼會用反碼和,而不是直接求和呢?或者是補碼和呢?因為在計算機裡面資料是以補碼的形式存在啊!經過看書查資料,下面總結一些這個校驗和演算法具體是怎麼實現的。

首先,ip、icmp、udp和tcp報文頭都有檢驗和字段,大小都是16bit,演算法基本上也是一樣的。

在傳送資料時,為了計算資料報的檢驗和。應該按如下步驟:

1、把校驗和字段設定為0;

2、把需要校驗的資料看成以16位為單位的數子組成,依次進行二進位制反碼求和;

3、把得到的結果存入校驗和字段中

在接收資料時,計算資料報的檢驗和相對簡單,按如下步驟:

1、把首部看成以16位為單位的數字組成,依次進行二進位制反碼求和,包括校驗和字段;

2、檢查計算出的校驗和的結果是否為0;

3、如果等於0,說明被整除,校驗和正確。否則,校驗和就是錯誤的,協議棧要拋棄這個資料報。

雖然說上面四種報文的校驗和演算法一樣,但是在作用範圍存在不同:ip校驗和只校驗20位元組的ip報頭;而icmp校驗和覆蓋整個報文(icmp報頭+icmp資料);udp和tcp校驗和不僅覆蓋整個報文,而且還有12個位元組的ip偽首部,包括源ip位址(4位元組)、目的ip位址(4位元組)、協議(2位元組)、tcp/udp包長(2位元組)。另外udp、tcp資料報的長度可以為奇數位元組,所以在計算校驗和時需要在最後增加填充位元組0(填充位元組只是為了計算校驗和,可以不被傳送)。

在udo傳輸協議中,校驗和是可選的,當校驗和字段為0時,表明該udp報文未使用校驗和,接收方就不需要校驗和檢查了!那如果udp校驗和的計算結果是0時怎麼辦?書上有一句話:「如果校驗和的計算結果為0,則存入的值為全1(65535),這在二進位制反碼計算中是等效的」

那麼校驗和到底怎麼計算了?

1、什麼是二進位制反碼求和

對乙個無符號的數,先求其反碼,然後從低位到高位,按位相加,有益處則向高位進1(和一般的二進位制法則一樣),若最高位有進製,則向最低位進1.

首先這裡的反反碼好像和以前學的有符號反碼不一樣,這裡不分正負數,直接每個為都取反。

上面加粗的那句話和我們平時的加法法則不一樣,最高位有進製,則向最低位進1。確實有些疑惑,為什麼要這樣呢?自習分析一下,上面的這種操作,使得在傳送加法進製溢位時,溢位值並不是10000,而是1111.也即是當相加結果滿1111時溢位,這樣也可以說明為什麼0000和1111都表示0了。

下面是兩種二進位制反碼求和的運算:

原碼加法運算:3(0011)+5(0101)=8(1000)

8(1000)+9(1001)=1(0001)

反碼加法運算:3(1100)+5(1010)=8(0111)

8(0111)+9(0110)=2(1101)

從上面的例子中,當加法未發生溢位時,原碼與反碼加法運算結果一樣;當有溢位時,結果就不一樣了,原碼是滿10000溢位,而反碼是滿1111溢位,所以相差正好是1.

另外,關於二進位制反碼求和運算需要說明的一點是,先取反後相加與先相加後取反,得到的結果是一樣的。

2、校驗和演算法實現

**如下:

ushort checksum (ushort *buffer,int size)

if (size)

//將32位轉換為16位

while (cksum>>16)

cksum = (cksum>>16) + (cksum & 0xffff);

return (ushort) (~cksum);

}buffer是指向需要校驗資料緩衝區的指標,size是需要檢驗資料的總長度(位元組為單位)。

4-13行**是對資料按16bit累加求和,由於最高位的進製需要加在最低位上,所以cksum必須是32位的unsigned long型,高16bit用於儲存累加過程中的進製;另外**10~13行是對size為奇數情況的處理。

14~16行**的作用是將cksum高16bit的值加到低16bit上,即把累加中最高位的進製加到最低位上。這裡使用了while迴圈,判斷cksum高16bit是否非零,因為第16行**執行的時候,還是可能向cksum的高16bit進製。

有些地方是通過下面兩條**實現的:

cksum = (cksum >> 16) + (cksum & 0xffff);

cksum = (cksum >> 16);

這裡只進行了兩次相加,即可保證相加後cksum的高16位為0,兩種方式的效果是一樣,事實上,上面的迴圈也最多執行兩次!

17行**即對16bit資料累加的結果取反,得到二進位制反碼求和的結果,然後函式返回該值。

3、為什麼使用二進位制反碼求和呢?

為什麼要使用二進位制反碼來計算校驗和呢,而不是直接使用原碼或者是補碼呢?

上面是原文的一部分,說明在tcp/ip校驗和中使用反碼求和的一些優點:

a、 不依賴系統是大端小端。即無論你是傳送方計算機或者接收方檢查校驗和時,都不要呼叫htons或者ntohs,直接通過上面的演算法就可以得到正確的結果。這個問題你可以自己舉個例子,用反碼求和時,交換16位數的位元組順序,得到的結果相同,只是位元組順序相應地也交換了;而如果使用原碼或者補碼求和,得到的結果可能就不同。

b、 計算和驗證校驗和比較簡單、快遞。

校驗和演算法

校驗和演算法 經常看計算機網路相關的書時,每次看到關於ip或者是udp報頭校驗和時,都是一笑而過,以為相當簡單的東西,不就是16bit資料的相加嗎!最近在學習ping命令的源待時,看到裡面有關於校驗和的演算法。一頭霧水,後來查詢資料,看到校驗和是16bit字的二進位制反碼和。總是覺得很奇怪,為什麼會...

校驗和演算法

校驗和演算法 經常看計算機網路相關的書時,每次看到關於ip或者是udp報頭校驗和時,都是一笑而過,以為相當簡單的東西,不就是16bit資料的相加嗎!最近在學習ping命令的源待時,看到裡面有關於校驗和的演算法。一頭霧水,後來查詢資料,看到校驗和是16bit字的二進位制反碼和。總是覺得很奇怪,為什麼會...

校驗和演算法

經常看計算機網路相關的書時,每次看到關於ip或者是udp報頭校驗和時,都是一笑而過,以為相當簡單的東西,不就是16bit資料的相加嗎!最近在學習ping命令的源待時,看到裡面有關於校驗和的演算法。一頭霧水,後來查詢資料,看到校驗和是16bit字的二進位制反碼和。總是覺得很奇怪,為什麼會用反碼和,而不...