如何使用python爬取網頁動態資料

2022-06-05 06:06:10 字數 1248 閱讀 8829

我們在使用python爬取網頁資料的時候,會遇到頁面的資料是通過js指令碼動態載入的情況,這時候我們就得模擬介面請求資訊,根據介面返回結果來獲取我們想要的資料。

首先我們通過開發者模式,找到請求該頁面的介面資訊

另外,為了能模擬瀏覽器訪問介面資訊,我們需要獲取到請求頭部資訊

獲取到以上資訊,我們就可以通過python的requests庫來模擬訪問介面啦

1、匯入requests庫

import requests

2、定義請求引數資訊

url = ""

header =

param =

3、獲取請求的json物件

ret = requests.get(url,params=param,headers=header)js = ret.json()print(js)

count = 0

for i in range(3):

param =

time.sleep(random.uniform(2, 3))

ret = requests.get(url, params=param, headers=header)

js = ret.json()

for info in js["subjects"]:

rate, title = info["rate"], info["title"]

print(f"《》的評分是:")

count += 20

這樣我們就獲取到想要的資料,不用挨個copy啦。我們可以把獲取的資料寫入到檔案裡永久儲存,並進行整理。下次再分享

Python 爬取網頁

先謝郭嘉 以鏈家二手房為例 1.爬取網頁所必須的庫 import urllib.request import ssl 2.獲取預爬網頁資訊 1 網頁url 3.下面就可以爬取網頁了 以鏈家二手房為例 1.爬取網頁所必須的庫 import urllib.request import ssl 2.獲取預...

Python 爬取網頁資訊

對於本次學習爬蟲中的一些總結 1.要熟練掌握基礎知識,包括一些基礎的語法 2.正規表示式的正確使用,建議學習北理工的python爬蟲課程 3.先寫大框架再新增小的功能解析 4.對程式異常處理要熟練,盡量使用try.excep結構 5.對於列表字串資料的基本使用到位,比如增刪改查等 6.思路必須清晰 ...

Python 爬蟲爬取網頁

工具 python 2.7 import urllib import urllib2 defgetpage url 爬去網頁的方法 request urllib.request url 訪問網頁 reponse urllib2.urlopen request 返回網頁 return response...