urllib請求返回網頁

開始學習python爬蟲

參考書籍《python網路爬蟲實戰》

出版社：清華大學出版社

主編：胡松濤

原書中使用的是python2，而我自己使用的是python3，所以在模組名稱方面有較大差異，特寫此記錄

urllib請求返回網頁

與書中的差異以及疑問都已標註在**段上

import urllib.request  
#書中使用的模組為urllib2，在python3中名稱變為urllib.request
import time, platform, os 
#書中並沒有匯入這幾個模組
def clear():
'''該函式用於清屏'''
print(u'內容較多，顯示3秒後翻頁')
#書中python2的寫入方法為response =urllib2.urlopen(url,timeout=3)
except urllib.request.urlerror:
print(u"網路位址錯誤")
# 書中這裡是用的是with open('./baidu.txt','w') as fp:
#執行會報錯typeerror: write() argument must be str, not bytes+
print(u"獲取url資訊，response.geturl() \n: %s " %response.geturl())
print(u"獲取返回**，response.getcode() \n %s "%response.getcode())
print(u"獲取返回資訊， response.info() \n: %s" %response.info())
print(u"獲取的網頁內容已經存入當前目錄的baidu.txt中")
if __name__ == '__main__':
linkbaidu()

參考於

urllib簡單網頁抓取

urllib包抓取網頁，處理url，包含模組用urllib實現簡單的網頁抓取 coding utf 8 from urllib import request import chardet if name main response request.urlopen html response.re...

網頁請求從URL到返回資料

從使用者在瀏覽器輸入網域名稱開始，到web頁面載入完畢，這是乙個說複雜不複雜，說簡單不簡單的過程，下文暫且把這個過程稱作網頁載入過程。下面我將依靠自己的經驗，總結一下整個過程。如有錯漏，歡迎指正。閱讀本文需要讀者已有一定的計算機知識，了解tcp dns等。眾所周知，開啟乙個網頁的過程中，瀏覽器會因頁...

Python爬蟲網路請求 urllib

簡單的請求from urllib.request import urlopen 發起網路請求 response urlopen assert response.code 200print 請求成功儲存請求的網頁 file變數接受open 函式返回的物件的 enter 返回結果 with open ...

urllib請求返回網頁

urllib簡單網頁抓取

網頁請求從URL到返回資料

Python爬蟲 網路請求 urllib

相關推薦

Python爬蟲網路請求 urllib