教你如何分析百度蛛蛛Baiduspider日誌

2021-08-31 06:08:50 字數 1908 閱讀 5663

我們注意粗體標註出來的地方

分析:b.[23/sep/2009:08:40:07 +0800] 這個是訪問的時間

c.get / http/1.1 get 表示請求,學過**變成都應該知道,這種請求一般有兩種:一是get,就是平常我們開啟乙個url訪問的動作,二是post,提交表單時的動作; http/1.1 表示http協議的版本

d.200 31909 這裡的200是正常返回,以下列出幾種常見的返回**以及所表示的含義

200 – 成功。 此狀態**表示 iis 已成功處理請求。

403 – 403表示沒有許可權,**沒有預設頁會顯示這個錯誤

404 – 未找到。 發生此錯誤的原因是您試圖訪問的檔案已被移走或刪除。

500 – 內部伺服器錯誤。 很多伺服器端的錯誤都可能導致該錯誤資訊。

502 – 閘道器錯誤。 如果試圖執行的 cgi 指令碼不返回有效的 http 標頭集,將出現此錯誤資訊。

g:"/usr/home/shijietools/htdocs/index.html"這個就檔案的絕對路徑了

附所有返回**

200——交易成功

201——提示知道新檔案的url

202——接受和處理、但處理未完成

203——返回資訊不確定或不完整

204——請求收到,但返回資訊為空

205——伺服器完成了請求,使用者**必須復位當前已經瀏覽過的檔案

206——伺服器已經完成了部分使用者的get請求

300——請求的資源可在多處得到

301——刪除請求資料

302——在其他位址發現了請求資料

303——建議客戶訪問其他url或訪問方式

304——客戶端已經執行了get,但檔案未變化

305——請求的資源必須從伺服器指定的位址得到

306——前一版本http中使用的**,現行版本中不再使用

307——申明請求的資源臨時性刪除

400——錯誤請求,如語法錯誤

401——請求授權失敗

402——保留有效chargeto頭響應

403——請求不允許

404——沒有發現檔案、查詢或url

405——使用者在request-line欄位定義的方法不允許

406——根據使用者傳送的accept拖,請求資源不可訪問

407——類似401,使用者必須首先在**伺服器上得到授權

408——客戶端沒有在使用者指定的餓時間內完成請求

409——對當前資源狀態,請求不能完成

410——伺服器上不再有此資源且無進一步的參考位址

411——伺服器拒絕使用者定義的content-length屬性請求

412——乙個或多個請求頭字段在當前請求中錯誤

413——請求的資源大於伺服器允許的大小

414——請求的資源url長於伺服器允許的長度

415——請求資源不支援請求專案格式

416——請求中包含range請求頭欄位,在當前請求資源範圍內沒有range指示值,請求也不包含if-range請求頭欄位

417——伺服器不滿足請求expect頭欄位指定的期望值,如果是**伺服器,可能是下一級伺服器不能滿足請求

500——伺服器產生內部錯誤

501——伺服器不支援請求的函式

502——伺服器暫時不可用,有時是為了防止發生系統過載

503——伺服器過載或暫停維修

504——關口過載,伺服器使用另乙個關口或服務來響應使用者,等待時間設定值較長

505——伺服器不支援或拒絕支請求頭中指定的http版本

百度XSS Worm 分析

css expression css表示式 可以在css中定義表示式 公式 來達到建立元素間屬性之間的聯絡等作用,從ie5開始支援,最後因為標準 效能 安全性等問題,微軟從ie8 beta2 開始取消對 css expression的支援。也就是說可以在css 後面插入一段js css的屬性值為其後...

面試分析(百度)

這是別人面試的題目,我自己無聊嘗試完成下 1.給乙個函式,返回0和1,概率為p和 1 p 請你實現乙個函式,使得返回0和1概率一樣。分析 該問題在左騰雲的書上有講過,思路一般利用乘和加數學方式完成,該題共分母 p 1 p 回答 設f x 為0 p 1 1 p p f x 為0 p 1 1 p 1 p...

百度產品分析

我本身不是做網際網路的,但是是想做網際網路的。網際網路起來這麼多公司,我們做管理軟體的,十幾年如一日,盈利模式一點沒有變,和網際網路一點關係也沒有。所以,管理軟體廠商如何走入網際網路,是我一直關注的。所以也研究網際網路的盈利模式。關於寬頻網上的教育,我一直看好。不過中國人,大人不學習,硬逼著孩子學習...