有道翻譯 爬蟲

2021-10-05 13:14:12 字數 507 閱讀 4614

目標**

user_agent身份驗證

請求頭設定

請求體資料

傳送請求並接收響應

接收資料簡單處理

在抓包工具中找到目標**,或者在瀏覽器開發者工具中找到**,不要找錯了!
user_agent身份資訊,這個比較簡單
請求頭內容用抓包工具可以獲得
抓包工具中的body表單--一般都是json格式的資料
pycharm中有對應的第三方庫

注意python2和python3的差異

字串的切片方法比較好用

正則,xpath應該也可以,但是在這次的案例中沒有使用(還不太熟悉)

然後換個瀏覽器或者登入使用者再看看還有什麼其他的變化

找到發生變化的變數之後,需要檢視源**,看加密規則.

爬蟲 有道翻譯

import time import requests import hashlib class youdaofanyi def get cookie self url ret requests.get url url return ret.headers.get set cookie def tr...

爬蟲 有道翻譯

author blues date 2020.9.8 python import hashlib import time import random import requests headers def func word r str int time.time 1000 1599574041 t...

爬蟲二 有道翻譯

import time,random,json from func all import post md5加密函式 defmd5 need str import hashlib 建立md5物件 md5 o hashlib.md5 需要有bytes,作為引數 sign bytes need str.e...