爬取動態載入的資料

2021-10-12 12:51:45 字數 1000 閱讀 1782

下面展示一些**

#要請求到每一家企業的id,對應的header裡

import requests

url=

''#首頁的url

data=

headers=

fp=open

('./company_detail.txt'

,'w'

,encoding=

'utf-8'

)#該json()的返回值中就有每家企業的id值

data_dic = requests.

post

(url=url,data=data,headers=headers)

.json()

#解析id

for dic in data_dic[

'list']:

_id=dic[

'id'

]# print(id

)#對每一家id對應的企業詳情資料進行捕獲(發起請求)

post_url=

''#詳情頁url

post_data=

#ison返回的某一家企業的資料

detail_dic=requests.

post

(url=post_url,data=post_data,headers=headers)

.json()

company_title=detail_dic[

'epsname'

] address=detail_dic[

'epsproductaddress'

] fp.

write

(company_title +

':'+ address+

'\n'

) fp.

flush()

print

(address,

'爬取成功!!!'

)fp.close

爬蟲學習之動態載入的頁面的爬取

selenium安裝及環境搭建 首先我們通過url來解析頁面,再對頁面的資訊進行爬取 引入必要的包 from selenium.webdriver import firefox from selenium.webdriver.firefox.options import options 通過spid...

python動態爬取知乎 python爬取微博動態

在初學爬蟲的過程中,我們會發現很多 都使用ajax技術動態載入資料,和常規的 不一樣,資料是動態載入的,如果我們使用常規的方法爬取網頁,得到的只是一堆html 沒有任何的資料。比如微博就是如此,我們可以通過下滑來獲取更多的動態。對於這樣的網頁該如何抓取呢?我們以微博使用者動態為例,抓取某名使用者的文...

爬取動態分頁資料案例

爬取東方財富 的財經新聞資料 1.爬取頁面中的標題和對應的內容 標題 內容 2.進行分頁操作,爬取當前頁面所有頁碼對應的標題和內容資料 3.不可以使用selenium 4.進行任意形式的持久化儲存 通過對 的分析發現翻頁時,有ajax資料報分析資料報的url發現,翻頁改變url中的引數,共20頁 u...