資料爬取 超級鷹驗證碼識別

2021-10-01 03:12:20 字數 1176 閱讀 9682

#!/usr/bin/env python

# coding:utf-8

import requests

from hashlib import md5

class chaojiying_client(object):

def __init__(self, username, password, soft_id):

self.username = username

password = password.encode('utf8')

self.password = md5(password).hexdigest()

self.soft_id = soft_id

self.base_params =

self.headers =

def postpic(self, im, codetype):

"""im: 位元組

codetype: 題目型別 參考

"""params =

params.update(self.base_params)

files =

r = requests.post('', data=params, files=files, headers=self.headers)

return r.json()

def reporterror(self, im_id):

"""im_id:報錯題目的id

"""params =

params.update(self.base_params)

r = requests.post('', data=params, headers=self.headers)

return r.json()

if __name__ == '__main__':

chaojiying = chaojiying_client('超級鷹使用者名稱', '超級鷹使用者名稱的密碼', '96001') #使用者中心》軟體id 生成乙個替換 96001

im = open('a.jpg', 'rb').read() #本地檔案路徑 來替換 a.jpg 有時win系統須要//

print chaojiying.postpic(im, 1902) #1902 驗證碼型別 官方**》**體系 3.4+版 print 後要加()

python爬蟲 爬取驗證碼並識別

步驟 呼叫平台 這裡使用的是超級鷹 提供的示例 進行資料識別 爬取古詩文網登入介面的驗證碼並識別 from lxml import etree from hashlib import md5 import requests import self class chaojiying client ob...

python 爬取12306驗證碼

import ssl import urllib2 i 1import time while 1 不加的話,無法訪問12306 time.sleep 1 有時需要加延時,以防被封。i i 1 f.write data f.close 以下就是爬取的 的截圖 12306的驗證碼經常讓人眼花繚亂,眼睛仔...

驗證碼 簡單驗證碼識別

這裡的驗證碼是內容非常簡單的,結構非常清晰的 這裡的驗證碼是內容非常簡單的,結構非常清晰的 這裡的驗證碼是內容非常簡單的,結構非常清晰的 興之所至之所以說簡單,我覺得是這樣的 抽了五張驗證碼扔進ps,50 透明度,長這樣 只有數字為內容 每張圖的數字都在固定位置 沒有太大的干擾因素 數字字型,形態完...