urllib請求返回網頁

2021-08-29 07:39:25 字數 1363 閱讀 8002

開始學習python爬蟲

參考書籍《python網路爬蟲實戰》

出版社:清華大學出版社

主編:胡松濤

原書中使用的是python2,而我自己使用的是python3,所以在模組名稱方面有較大差異,特寫此記錄

urllib請求返回網頁

與書中的差異以及疑問都已標註在**段上

import urllib.request  

#書中使用的模組為urllib2,在python3中名稱變為urllib.request

import time, platform, os

#書中並沒有匯入這幾個模組

def clear():

'''該函式用於清屏'''

print(u'內容較多,顯示3秒後翻頁')

#書中python2的寫入方法為response =urllib2.urlopen(url,timeout=3)

except urllib.request.urlerror:

print(u"網路位址錯誤")

# 書中這裡是用的是with open('./baidu.txt','w') as fp:

#執行會報錯typeerror: write() argument must be str, not bytes+

print(u"獲取url資訊,response.geturl() \n: %s " %response.geturl())

print(u"獲取返回**,response.getcode() \n %s "%response.getcode())

print(u"獲取返回資訊, response.info() \n: %s" %response.info())

print(u"獲取的網頁內容已經存入當前目錄的baidu.txt中")

if __name__ == '__main__':

linkbaidu()

參考於

urllib簡單網頁抓取

urllib包 抓取網頁,處理url,包含模組 用urllib實現簡單的網頁抓取 coding utf 8 from urllib import request import chardet if name main response request.urlopen html response.re...

網頁請求從URL到返回資料

從使用者在瀏覽器輸入網域名稱開始,到web頁面載入完畢,這是乙個說複雜不複雜,說簡單不簡單的過程,下文暫且把這個過程稱作網頁載入過程。下面我將依靠自己的經驗,總結一下整個過程。如有錯漏,歡迎指正。閱讀本文需要讀者已有一定的計算機知識,了解tcp dns等。眾所周知,開啟乙個網頁的過程中,瀏覽器會因頁...

Python爬蟲 網路請求 urllib

簡單的請求from urllib.request import urlopen 發起網路請求 response urlopen assert response.code 200print 請求成功 儲存請求的網頁 file變數接受open 函式返回的物件的 enter 返回結果 with open ...