Python 花瓣網動態爬蟲

2022-06-03 05:39:10 字數 1158 閱讀 2116

好久沒有寫爬蟲了,之前只是止步於爬取靜態網頁,於是準備找個簡單的動態網頁進行爬取,在學長的建議下,進軍花瓣網。

首先在爬取之前肯定要對網頁原始碼進行分析

這裡可以使用chrome的f12開發人員工具,很簡單就找到了的url,這不就直接可以開始爬取了麼2333

但是事實並不是這樣,我使用requests.get獲取網頁原始碼後,發現和我看到的網頁原始碼跟不就不是乙個東西

之後根據網上資料查詢,發現獲取的其實是json格式的一大串資料。這時候開啟開發人員工具,然後選擇network,選擇xhr,你開始往下拖動,會發現每次網頁載入就會出現新的xhr檔案

上面畫紅線的都是有內容的一次載入的xhr檔案,點選第乙個,再選擇preview,開啟pins

這裡面就是一次載入的20張**的json格式資訊,點開第0個,觀察裡面資訊

其實這裡需要的只是每一張的pin_id和key

pin_id是用來讓指令碼持續獲得新的,讀者可自行觀察下每次重新整理出的包含20張的那個xhr檔案**是由

最基礎**)+?jb67d549(這個不清楚,但是不影響,因為並沒有值)&max=891511322(每20組第一張pin_id)&limit=20&wfl=1(後面這兩個是固定的)

附上原始碼

最後附上美食:

花瓣網維護是怎麼回事 花瓣網是要被封了嗎

對於設計師來說,今天最大的壞訊息莫過於 花瓣網打不開 了。今天,不少設計師紛bylwhie紛在微博哭訴花瓣網打不開了。點選官網鏈結,只能看到偌大的維護公告。據公告頁面顯示,花瓣網www.cppcns.com將從今天起至 2 月 15 日之bylwhie間進行技術公升級和維護。也就是說,在這長達乙個月...

python動態爬蟲 Python動態網頁爬蟲技術

這一講,我將會為大家講解稍微複雜一點的爬蟲,即動態網頁的爬蟲。動態網頁技術介紹 動態網頁爬蟲技術一之api請求法 動態網頁爬蟲技術二之模擬瀏覽器法 google chrome driver安裝 課後作業 關於作者 動態網頁技術介紹 所謂的動態網頁,是指跟靜態網頁相對的一種網頁程式設計技術。靜態網頁,...

python爬蟲人人網登陸

匯入模組from urllib import request,parse from http import cookiejar 儲存cookie,例項化cookiecookie cookiejar.cookiejar com plogin.do 登入賬號密碼data 轉換格式data parse.u...