爬蟲反爬之驗證碼

2021-10-10 01:25:13 字數 2499 閱讀 9997

if __name__ ==

'__main__'

: chaojiying = chaojiying_client(

'超級鷹使用者名稱'

,'超級鷹使用者名稱的密碼'

,'96001'

)#使用者中心》軟體id 生成乙個替換 96001

)#本地檔案路徑 來替換 a.jpg 有時win系統須要//

print

(chaojiying.postpic(im,

1902))

#1902 驗證碼型別

from chaojiying import chaojiying_client

defget_text

(imgpath,imgtype)

: chaojiying = chaojiying_client(

'超級鷹使用者名稱'

,'超級鷹使用者密碼'

,'軟體id'

)# 使用者中心》軟體id 生成乙個替換 96001

im =

open

(imgpath,

'rb'

).read(

)return chaojiying.postpic(im, imgtype)

['pic_str'

]#imgtype為驗證碼型別,例如:英文數字型別 1902,中文字元 2001等

from chaojiying import chaojiying_client

import requests

from lxml import etree

s = requests.session(

)headers =

# 獲取驗證碼

defget_text

(imgpath,imgtype)

:def

get_text

(imgpath,imgtype)

: chaojiying = chaojiying_client(

'超級鷹使用者名稱'

,'超級鷹使用者密碼'

,'軟體id'

)# 使用者中心》軟體id 生成乙個替換 96001

im =

open

(imgpath,

'rb'

).read(

)return chaojiying.postpic(im, imgtype)

['pic_str'

]#imgtype為驗證碼型別,例如:英文數字型別 1902,中文字元 2001等

# 古詩文頁面

url =

''page_text = s.get(url,headers=headers)

.text

tree = etree.html(page_text)

# 獲取驗證碼位址

img_src =

''+tree.xpath(

'//*[@id="imgcode"]/@src')[

0]img_data = s.get(img_src,headers=headers)

.content

# 儲存驗證碼

# 將動態變化的請求引數解析出來

__viewstate = tree.xpath(

'//*[@id="__viewstate"]/@value')[

0]__viewstategenerator = tree.xpath(

'//*[@id="__viewstategenerator"]/@value')[

0]# 通過超級鷹識別驗證碼

# 登入驗證頁面

python爬蟲 爬取驗證碼並識別

步驟 呼叫平台 這裡使用的是超級鷹 提供的示例 進行資料識別 爬取古詩文網登入介面的驗證碼並識別 from lxml import etree from hashlib import md5 import requests import self class chaojiying client ob...

爬蟲之驗證碼破解(四)

註冊超級鷹賬戶超級鷹官網 官網有詳細使用說明,以下是api使用方法。from hashlib import md5 class chaojiying client object def init self,username,password,soft id self.username usernam...

爬蟲之識別驗證碼元件

超級鷹提供的示例 usr bin env python coding utf 8 import requests from hashlib import md5 class chaojiying client object def init self,username,password,soft i...