爬蟲 模擬登入

2022-10-11 14:45:14 字數 778 閱讀 7369

模擬登入流程:

對點選登入按鈕對應的請求進行傳送(post請求)

處理請求引數:

--使用者名稱

--密碼

--驗證碼

--其他的防偽引數 

模擬登入cookie操作:

1.手動cookie處理

通過抓包工具獲取cookie值,將該值封裝到headers中

2.自動處理cookie

模擬登入post請求後,cookie由伺服器端建立

session會話物件:

1.可以進行請求的傳送

2.如果請求過程中產生了cookie,則該cookie會被自動儲存在該session物件中

--建立乙個session物件:session = requests.session()

--使用session物件進行模擬登入post請求的傳送(cookie會被儲存在session中)

--session物件對個人主頁對應的get請求進行傳送

session =requests.session()

response = session.post(url=url,headers=headers,data=data)

# cookie會自動儲存到session物件中,之後需要用到cookie時,使用session物件進行傳送

page_text = session.get(url=url,headers=headers).text # 攜帶了cookie值傳送

爬蟲 模擬登入

在一些爬蟲中,需要用到賬號登入進入,才能看到需要爬取的內容,因此實現程式自動模擬登入非常有必要。目前大部分 的登入,都是使用表單提交的方法實現的,這一類 的模擬登入,相信度娘已經給出來的許多例項。還有一類 不是使用網頁自帶表單提交的方法,自己實現了js方法來登入,這就需要進行特別的模擬瀏覽器行為。本...

爬蟲之模擬登入總結

有些 需要 登入 後才能爬取所需要的資訊,此時可以設計爬蟲進行模擬登入,原理是利用瀏覽器cookie。一 瀏覽器訪問伺服器的過程 1 瀏覽器 客戶端 向web伺服器發出乙個http請求 http request 2 web伺服器收到請求,發回響應資訊 http response 3 瀏覽器解析內容呈...

python爬蟲cookie模擬登入

抓取需要登入才能訪問的頁面1 先登入成功1次,獲取到攜帶登陸資訊的cookie f12開啟控制台,在頁面輸入使用者名稱 密碼,登入成功,找到 home 一般在抓到位址的上面 2 攜帶著cookie發請求 cookie referer 源,代表你從 轉過來的 user agentimport requ...