手寫爬蟲模擬登陸 無驗證碼

2021-08-22 10:10:55 字數 715 閱讀 7607

框架用多了,都是別人寫好的一些內容,最近想自己手寫乙份爬蟲模擬登陸系統,手寫有什麼好處呢?可以讓你更好的去理解爬蟲系統.我用的linux系統,pycharm版本3.6,

首先手寫的你需要安裝requests:pip3 install requests

我們以訪問抽屜為例:

接下來我們模擬登陸,模擬登陸我們需要模仿瀏覽器提交的資料,提交的方式為post,在這裡我們帶上前面獲取的cookie,帶上登陸需要的賬號密碼,並且帶上user-agent來模擬瀏覽器登陸,不然會被攔截

response = requests.post(

url='login',

data=,

headers=,

cookies = r1.cookies.get_dict()

最後,我們可以檢測有沒有登陸成功

print(response.text)

結果如下:

}} 說明登陸成功了,登陸成功那麼該頁面我們就可以獲取頁面和解析頁面來爬蟲了,這裡就不介紹了

總體**如下:

import requests

response = requests.post(

url='login',

data=,

print(response.text)

爬蟲入門四(驗證碼識別和模擬登陸)

超級鷹的使用流程 超級鷹 import requests from hashlib import md5 class chaojiying client object def init self,username,password,soft id self.username username pas...

python 爬蟲(7) 驗證碼登陸 12306

登陸乙個介面需要使用者名稱 密碼 還有驗證碼。驗證碼的辨識,一般都是第三方,且需要付費的。比如雲打碼,打碼兔,超級鷹。12306用的是超級鷹。得到驗證碼 1.訪問網頁 3.儲存到本地 4.識別驗證碼 得到字串或者數字 from lxml import etree import requests he...

curl模擬請求 登陸以及帶驗證碼登陸

php view plain copy header content type text html charset utf 8 function curlpost url data method curl setopt ch curlopt returntransfer,true tmpinfo c...