Python爬蟲02 請求模組

2021-10-08 04:21:33 字數 2843 閱讀 6375

七、json資料

response.text 返回unicode格式的資料(str)

response.content 返回位元組流資料(二進位制)

response.content.decode(『utf-8』) 手動進行解碼

response.url 返回url

response.encode() = 『編碼』

import requests

url=

''headers=

wd=res=requests.get(url,params=wd,headers=headers)

print

(res.url)

# 返回請求的url

# wd=%e4%b8%ad%e5%9b%bd

獲取網頁源**

import requests

res=requests.get(

'')print

(res.text)

# 中文亂碼

print

(res.content.decode(

'utf-8'))

# 手動解碼

匯入模組

import requests

import json

key=

input

('請輸入:'

)data =

發起請求獲取響應

url需要去掉_o

url =

''headers =

res = requests.post(url,data=data,headers=headers)

res.encoding =

'utf-8'

html = res.text

# 或 html=res.content.decode('utf-8')

把json型別的字串轉換成字典 json.loads()

j_s=json.loads(html)

trans=j_s[

'translateresult'][

0][0

]['tgt'

]print

(trans)

使用requests新增**只需要在請求方法中(get/post)傳遞proxies引數就可以

import requests

proxy =

url =

''res = requests.get(url,proxies=proxy)

print

(res.text)

import requests

url =

''res = requests.get(url,verify=

false

)print

(res.text)

headers=

import requests

url=

''headers=

res=requests.get(url,headers=headers)

print

(res.text)

import requests

url =

''headers =

res = requests.get(url,headers=headers)

print

(res.content.decode(

'utf-8'

))

保持會話

import requests

req=requests.session(

)headers=

def

login()

:# 拿到驗證碼

res=req.get(

'') pic=res.content

with

open

('yzm.png'

,'wb'

)as f:

f.write(pic)

s=input

('請輸入驗證碼座標:'

) data=

response=req.post(

'',data=data,headers=headers)

print

(response.text)

login(

)

import json

s='pyt'

python資料型別 --> json型別字串

r=json.dumps(s)

print

(r)# "pyt"

json資料型別 --> python型別字串

print

(json.loads(r)

)# pyt

python資料型別 --> json檔案字串

json.dump(s,

open

('json.txt'

,'w'

)

json型別檔案–>python資料型別

print

(json.load(

open

('json.txt'

,'r'))

)

python 爬蟲請求模組requests詳解

相比urllib,第三方庫requests更加簡單人性化,是爬蟲工作中常用的庫 初級爬蟲的開始主要是使用requests模組 安裝requests模組 windows系統 cmd中 pip install requests mac系統中 終端中 pip3 install requests impor...

爬蟲請求模組

1 版本 python2 urllib urllib2 python3 把urllib 和 urllib2合併,urllib.request 2 常用方法 2.1.1位元組流 response.read 字串 response.read decode utf 8 31 encode 字串 bytes...

爬蟲請求模組

2.urllib.parse 3.請求方式 4.request模組 5.requests原始碼分析 位元組流 response.read 字串 response.read decode utf 8 urllib.request.request headers 字典 import urllib.req...