第乙個爬蟲

2022-06-02 10:51:14 字數 3994 閱讀 4056

一:程式測試

二:開啟360網頁

三:html計算

四:中國大學排名(爬取年費2018)

五:函式介紹總結

1.requests 庫的網頁請求函式

函式

說明

get(url [, timeout=n])

對應http的get方式,設定請求超時時間為n秒

post(url, data=)

對應http的post方式,字典用於傳輸客戶資料

delete(url)

對應http的delete方式

head(url)

對應http的head方式

options(url)

對應http的options方式

put(url, data=)

對應http的put方式,字典用於傳輸客戶資料

2.response物件的屬性

屬性

說明

status_code

http請求的返回狀態

encoding

http響應內容的編碼方式

text

http響應內容的字串形式

content

http響應內容的二進位制形式

response物件的方法

方法

說明

json()

若http響應內容中包含json格式資料, 則解析json資料

raise_for_status()

若http返回的狀態碼不是200, 則產生異常

第乙個爬蟲

很多人學習python的目的就是為了學習能夠實現爬蟲的功能,這裡,我使用了scrapy框架來實現了乙個簡單的爬蟲功能,這裡我簡單的介紹一下scrapy專案的建立,和執行。1,第一步是安裝scrapy,我相信到了這一步,大多數人都已經會安裝第三方庫檔案了,這裡主要是使用命令pip install sc...

第乙個爬蟲

今天打算開始著手做bioasq的專案 除了看 的部分。學長分配的最初步內容是,去統計一下資料集裡面list factoid的數量,以及exact ans 在 snippets中的出現次數。本來覺得這是個很簡單的資料處理任務嘛,然後突然意識到,snippets裡的document給的是 這豈不是意味著...

python爬蟲 第乙個爬蟲

1.本地安裝了nginx,在預設的html目錄下建立測試html 如圖,即index.html導向a,b,c 3個html,a.html又可以導向aa,bb兩個html,c.html可以導向cc.html。2.修改nignx配置使得本地可以訪問寫的kmtest裡的index.html。參考文件 ng...