在核心中C語言實現htons 函式

2021-07-10 22:02:20 字數 4333 閱讀 8189

網路位元組順序是tcp/ip中規定好的一種資料表示格式,它與具體的cpu型別、作業系統等無關,從而可以保證資料在不同主機之間傳輸時能夠被正確解釋,網路位元組順序採用big-endian排序(大尾順序)方式。

因為專案中需要,設定例如來自埠號為9877的資料要做些什麼處理,在上層設定了9877這個數字,但是讀取tcp頭部(tcp頭部的前十六位元組為源埠號),發現不是原想的9877這個數,而是38182。

因為他是傳入9877,通過htons()函式轉變為網路位元組順序(見上),也就能理解為何網路程式設計時候會使用:

servaddr.sin_port =htons(9877);
但是因為在開發板的核心中,無法直接呼叫這個函式,所以需要自己實現該功能,結合網上查詢,方法實現如下:

#define biglittleswap16(a)  ((((uint16)(a) & 0xff00) >> 8) | (((uint16)(a) & 0x00ff) << 8)) 

int checkcpuendian()

c; c.i = 0x12345678;

return (0x12 == c.s[0]);

}unsigned

short

int htons(unsigned

short

int h)

下邊的是摘錄自

part 1: htons函式具體解釋

在linux和windows網路程式設計時需要用到htons和htonl函式,用來將主機位元組順序轉換為網路位元組順序。

在intel機器下,執行以下程式

int main()

...

得到的結果是4096,初一看感覺很怪。

解釋如下,數字16的16進製表示為0x0010,數字4096的16進製表示為0x1000。 由於intel機器是小尾端,儲存數字16時實際順序為1000,儲存4096時實際順序為0010。因此在傳送網路包時為了報文中資料為0010,需要經過htons進行位元組轉換。如果用ibm等大尾端機器,則沒有這種位元組順序轉換,但為了程式的可移植性,也最好用這個函式。
另外用注意,數字所佔位數小於或等於乙個位元組(8 bits)時,不要用htons轉換。這是因為對於主機來說,大小尾端的最小單位為位元組(byte)。

part 2: 大小端模式

不同的cpu有不同的位元組序型別 這些位元組序是指整數在記憶體中儲存的順序 這個叫做主機序

最常見的有兩種

1. little endian:將低序位元組儲存在起始位址

2. big endian:將高序位元組儲存在起始位址

le little-endian

最符合人的思維的位元組序

位址低位儲存值的低位

位址高位儲存值的高位

怎麼講是最符合人的思維的位元組序,是因為從人的第一觀感來說

低位值小,就應該放在記憶體位址小的地方,也即記憶體位址低位

反之,高位值就應該放在記憶體位址大的地方,也即記憶體位址高位

be big-endian

最直觀的位元組序

位址低位儲存值的高位

位址高位儲存值的低位

為什麼說直觀,不要考慮對應關係

只需要把記憶體位址從左到右按照由低到高的順序寫出

把值按照通常的高位到低位的順序寫出

兩者對照,乙個位元組乙個位元組的填充進去

例子:在記憶體中雙字0x01020304(dword)的儲存方式

記憶體位址

4000 4001 4002 4003

le 04 03 02 01

be 01 02 03 04

例子:如果我們將0x1234abcd寫入到以0x0000開始的記憶體中,則結果為

big-endian little-endian

0x0000 0x12 0xcd

0x0001 0x23 0xab

0x0002 0xab 0x34

0x0003 0xcd 0x12

x86系列cpu都是little-endian的位元組序.

網路位元組順序是tcp/ip中規定好的一種資料表示格式,它與具體的cpu型別、作業系統等無關,從而可以保證資料在不同主機之間傳輸時能夠被正確解釋。網路位元組順序採用big endian排序方式。

為了進行轉換 bsd socket提供了轉換的函式 有下面四個

htons 把unsigned short型別從主機序轉換到網路序

htonl 把unsigned long型別從主機序轉換到網路序

ntohs 把unsigned short型別從網路序轉換到主機序

ntohl 把unsigned long型別從網路序轉換到主機序

在使用little endian的系統中 這些函式會把位元組序進行轉換

在使用big endian型別的系統中 這些函式會定義成空巨集

同樣 在網路程式開發時 或是跨平台開發時 也應該注意保證只用一種位元組序 不然兩方的解釋不一樣就會產生bug.

注: 1、網路與主機位元組轉換函式:htons ntohs htonl ntohl (s 就是short l是long h是host n是network)

2、不同的cpu上執行不同的作業系統,位元組序也是不同的,參見下表。

處理器 作業系統 位元組排序

alpha 全部 little endian

hp-pa nt little endian

hp-pa unix big endian

intelx86 全部 little endian <—–x86系統是小端位元組序系統

motorola680x() 全部 big endian

mips nt little endian

mips unix big endian

powerpc nt little endian

powerpc 非nt big endian <—–ppc系統是大端位元組序系統

rs/6000 unix big endian

sparc unix big endian

ixp1200 arm核心 全部 little endian

part 3: 模擬htonl、ntohl、htons、ntohs函式實現

今天在如鵬網裡討論htonl、ntohl在不同機器的區別,特意模擬了htonl、ntohl、htons、ntohs函式實現。

實現如下:

typedef

unsigned

short

int uint16;

typedef

unsigned

long

int uint32;

// 短整型大小端互換

#define biglittleswap16(a) ((((uint16)(a) & 0xff00) >> 8) | /

(((uint16)(a) & 0x00ff) << 8))

// 長整型大小端互換

#define biglittleswap32(a) ((((uint32)(a) & 0xff000000) >> 24) | /

(((uint32)(a) & 0x00ff0000) >> 8) | /

(((uint32)(a) & 0x0000ff00) << 8) | /

(((uint32)(a) & 0x000000ff) << 24))

// 本機大端返回1,小端返回0

int checkcpuendian()

c; c.i = 0x12345678;

return (0x12 == c.s[0]);

}// 模擬htonl函式,本機位元組序轉網路位元組序

unsigned

long

int htonl(unsigned

long

int h)

// 模擬ntohl函式,網路位元組序轉本機位元組序

unsigned

long

int ntohl(unsigned

long

int n)

// 模擬htons函式,本機位元組序轉網路位元組序

unsigned

short

int htons(unsigned

short

int h)

// 模擬ntohs函式,網路位元組序轉本機位元組序

unsigned

short

int ntohs(unsigned

short

int n)

C語言 實現memcopy memmove函式

memmove用於從src拷貝count個字元到dest,如果目標區域和源區域有重疊的話,memmove能夠保證源串在被覆蓋之前將重疊區域的位元組拷貝到目標區域中。但複製後src內容會被更改。但是當目標區域與源區域沒有重疊則和memcpy函式功能相同。include include include ...

linux核心中用C語言實現物件導向思想

初衷 linux核心大量使用物件導向的編碼風格。然而linux核心是完全使用c寫的。專案使用的通訊規約也是物件導向的。物件導向一直是一種思想,c語言也可以實現其思想。物件導向思想 封裝繼承 建構函式多型 封裝就是猶抱琵琶半遮面,使用結構體。linux核心裡用到類的繼承關係,這種關係使用c語言實現就是...

PHP變數在核心中的實現

我們都知道php是乙個弱型別語言,它的變數理論上可以儲存任何型別的資料。那麼,php的變數在核心中究竟是怎麼實現的呢?在php核心中,變數稱為zval,變數的值稱為zend value,注意這是兩個不同的東西。php中變數的記憶體是通過引用計數的方式進行管理的,在php7之前,zval容器中有兩個位...