教你如何分析百度蛛蛛Baiduspider日誌

我們注意粗體標註出來的地方

分析：b.[23/sep/2009:08:40:07 +0800] 這個是訪問的時間

c.get / http/1.1 get 表示請求，學過**變成都應該知道，這種請求一般有兩種：一是get，就是平常我們開啟乙個url訪問的動作，二是post，提交表單時的動作； http/1.1 表示http協議的版本

d.200 31909 這裡的200是正常返回，以下列出幾種常見的返回**以及所表示的含義

200 – 成功。此狀態**表示 iis 已成功處理請求。

403 – 403表示沒有許可權，**沒有預設頁會顯示這個錯誤

404 – 未找到。發生此錯誤的原因是您試圖訪問的檔案已被移走或刪除。

500 – 內部伺服器錯誤。很多伺服器端的錯誤都可能導致該錯誤資訊。

502 – 閘道器錯誤。如果試圖執行的 cgi 指令碼不返回有效的 http 標頭集，將出現此錯誤資訊。

g:"/usr/home/shijietools/htdocs/index.html"這個就檔案的絕對路徑了

附所有返回**

200——交易成功

201——提示知道新檔案的url

202——接受和處理、但處理未完成

203——返回資訊不確定或不完整

204——請求收到，但返回資訊為空

205——伺服器完成了請求，使用者**必須復位當前已經瀏覽過的檔案

206——伺服器已經完成了部分使用者的get請求

300——請求的資源可在多處得到

301——刪除請求資料

302——在其他位址發現了請求資料

303——建議客戶訪問其他url或訪問方式

304——客戶端已經執行了get，但檔案未變化

305——請求的資源必須從伺服器指定的位址得到

306——前一版本http中使用的**，現行版本中不再使用

307——申明請求的資源臨時性刪除

400——錯誤請求，如語法錯誤

401——請求授權失敗

402——保留有效chargeto頭響應

403——請求不允許

404——沒有發現檔案、查詢或url

405——使用者在request-line欄位定義的方法不允許

406——根據使用者傳送的accept拖，請求資源不可訪問

407——類似401，使用者必須首先在**伺服器上得到授權

408——客戶端沒有在使用者指定的餓時間內完成請求

409——對當前資源狀態，請求不能完成

410——伺服器上不再有此資源且無進一步的參考位址

411——伺服器拒絕使用者定義的content-length屬性請求

412——乙個或多個請求頭字段在當前請求中錯誤

413——請求的資源大於伺服器允許的大小

414——請求的資源url長於伺服器允許的長度

415——請求資源不支援請求專案格式

416——請求中包含range請求頭欄位，在當前請求資源範圍內沒有range指示值，請求也不包含if-range請求頭欄位

417——伺服器不滿足請求expect頭欄位指定的期望值，如果是**伺服器，可能是下一級伺服器不能滿足請求

500——伺服器產生內部錯誤

501——伺服器不支援請求的函式

502——伺服器暫時不可用，有時是為了防止發生系統過載

503——伺服器過載或暫停維修

504——關口過載，伺服器使用另乙個關口或服務來響應使用者，等待時間設定值較長

505——伺服器不支援或拒絕支請求頭中指定的http版本

百度XSS Worm 分析

css expression css表示式可以在css中定義表示式公式來達到建立元素間屬性之間的聯絡等作用，從ie5開始支援，最後因為標準效能安全性等問題，微軟從ie8 beta2 開始取消對 css expression的支援。也就是說可以在css 後面插入一段js css的屬性值為其後...

面試分析（百度）

這是別人面試的題目，我自己無聊嘗試完成下 1.給乙個函式，返回0和1，概率為p和 1 p 請你實現乙個函式，使得返回0和1概率一樣。分析該問題在左騰雲的書上有講過，思路一般利用乘和加數學方式完成,該題共分母 p 1 p 回答設f x 為0 p 1 1 p p f x 為0 p 1 1 p 1 p...

百度產品分析

我本身不是做網際網路的，但是是想做網際網路的。網際網路起來這麼多公司，我們做管理軟體的，十幾年如一日，盈利模式一點沒有變，和網際網路一點關係也沒有。所以，管理軟體廠商如何走入網際網路，是我一直關注的。所以也研究網際網路的盈利模式。關於寬頻網上的教育，我一直看好。不過中國人，大人不學習，硬逼著孩子學習...

教你如何分析百度蛛蛛Baiduspider日誌

百度XSS Worm 分析

面試分析（百度）

百度產品分析

相關推薦