python爬蟲學習(三)百度翻譯

2021-10-01 17:19:00 字數 939 閱讀 5477

#post請求(攜帶了引數)

#響應資料是一組json資料

抓包的話用fiddle或者在頁面f12用谷歌開發者工具

# -*- coding: utf-8 -*-

import requests

import json

if __name__ == '__main__':

#step1 指定url

post_url =''

#step2 ua偽裝

headers =

#step3 post請求引數出路(和get一樣)

word = input('enter a word:')

data =

#step4 傳送請求

#url = posturl data= 引數字典

response = requests.post(url=post_url,data=data,headers=headers)

#step5 獲取響應資料

#json方法返回是obj(物件),如果確認響應資料是json型別的 才可以使用json()

dic_obj = response.json()

#test

#print(dic_obj)

#step6 儲存返回的資料

filename =word+'.json'

fp =open(filename,'w',encoding='utf-8')

#json中含有中文,所以要加上ensure_ascii=false

json.dump(dic_obj,fp=fp,ensure_ascii=false)

print(filename,"完成")

百度翻譯 爬蟲

2.開啟抓包,發現有三個sub的post請求,確定為ajax,最後乙個post請求攜帶完整引數dog 3.然後檢視返回資料為json串 import requests import json if name main post url kw input 請輸入你要翻譯的文字 修改爬蟲的ua為瀏覽器的...

爬蟲學習系列(三) 破解百度翻譯

post請求 攜帶了引數 響應資料是一組json資料 import requests import json post url ua偽裝 headers post 請求引數處理 同get請求一致 data response requests.post url post url,data data h...

用爬蟲模擬百度翻譯

import requests import json import sys class baifanyi def init self,trant str self.trant str trant str self.lan url self.trant url def parse url self,...