獲取網頁的基本流程

2021-05-26 10:54:19 字數 2454 閱讀 5492

1. 獲得ip位址(表達格式)的基本方式

struct hostent* host_ent;

host_ent = gethostbyname(host_addr); // host_addr基本乙個字串,例如「net.pku.edu.cn」

char abuf[inet_addrstrlen];

inet_ntop(af_inet, host_ent->h_addr_list[0], abuf, sizeof(abuf));

// 這樣,abuf中放置的就是ip的表達格式,字串「162.105.129.12」

// 但是注意這個不是乙個c-str,因為不是以'\0'結尾,需要重新放置。

int len = strlen(abuf);

char* result = new char[len + 1];

memset( result, 0, len+1 );

memcpy( result, abuf, len );

// result中即為最後的結果

2. 建立socket連線

a. 建立socket,參考http_fetcher的makesocket

b. 構造請求buffer,乙個簡單的例子如下:

c. 讀取頭資訊,參考http_fetcher的_http_read_header函式。 //

網頁訪問流程

graph lr 瀏覽器 輸入 傳遞給 dns dns 實際ip位址 瀏覽器 瀏覽器 http tcp ip協議 伺服器 當然你不能隨便訪問任何乙個販毒集團根據http協議你需要有 訪問口信 而且根據tcp協議,這張紙條必須分割成眾多的小文段 瀏覽器寫了 訪問口信 並把這張紙條弄成很多份 乙份乙份地...

獲取網頁亂碼

亂碼 curl www.1ting.com more 亂碼 curl h accept encoding gzip www.1ting.com more 不亂碼 curl h accept encoding gzip www.1ting.com gunzip more 不亂碼 curl www.16...

網頁的基本結構

網頁主要由導航欄 欄目 正文內容組成的.meta標籤只有1個標籤,單標籤。charset utf 8 叫標籤屬性,寫在開始標籤中,格式 屬性名 屬性值 charset編碼格式,字符集。3.1 中國 gb2312。3.2 美國 ascii。3.3 萬國碼 utf8。1.注釋快捷鍵 ctrl 注釋的作用...