小鳥遊的Python爬蟲學習筆記 基本庫的使用

2021-08-21 00:14:47 字數 568 閱讀 3985

在python學習中經常碰到的問題就是python版本的問題,現在全面轉向python3的使用和學習。

在python2中,有urllib和urllib2兩個庫來實現請求的傳送。而在python3中,統一為urllib。

import urllib.request

response = urllib.request.urlopen('')

print(response.read().decode('utf-8'))

print(type(response)) #檢視返回的響應型別

print(response.status) #檢視響應狀態碼

print(response.getheaders) #檢視響應頭資訊

print(response.getheader('server')) #檢視響應頭中的server值

執行結果:

第乙個列印的結果太長省略了是後面的四個列印結果

Python爬蟲學習

最近由於 需要,用python寫了爬蟲爬取資料。在這個過程中,認識到學習一門語言最好的辦法是動手,別無技巧。在動手程式設計的過程中,遇到了很多意想不到的問題,當然也學習了很多書本上不會講述的知識,感覺這才是真正的學習知識。在這個過程中,遇到的乙個問題讓我花費了很久時間,留下了很深的印象。擔心會隨著時...

Python學習 爬蟲

在搜尋python知識的時候一直看到爬蟲相關知識,感覺挺好玩的,打算簡單了解一下。1 找到伺服器主機,向伺服器發出乙個請求,伺服器經過解析之後,傳送給使用者的瀏覽器 html js css 等檔案,瀏覽器解析出來,使用者便可以看到形形色色的了。因此,使用者看到的網頁實質是由 html 構成的,爬蟲爬...

python爬蟲學習

例如列印當前時間 from datetime import datetime print datetime.now 或者import datetime print datetime.datetime.now html結構 html head body html head a useful page ...