Python爬蟲 獲取2023年6月份全社會用電量

2021-10-05 14:51:52 字數 2430 閱讀 6425

專案總結

​ 全社會用電量數值表示某個階段用電需求,也是體現了經濟發展趨勢的指標之一。本專案獲取的數值是2023年6月份全社會用電量,**於報道—6月份全社會用電量4384億千瓦時 同比增長6.3%開啟6月份全社會用電量4384億千瓦時 同比增長6.3%這篇報道,你會發現資料資訊可以直接複製到excel中。那麼,本專案為什麼要用python爬蟲獲取資料?如果我們想獲得2023年全全社會用電量,或者更多年份的資料時,單憑一人之力複製貼上就有點麻煩。本專案是為了方便更多研究資料的人,順便提高自己的python程式設計能力。

中畫紅線部分是我們想要的資料,並發現資料都在標籤中。

list1=

for k in soup.findall(

'p')

:, u' '))

del list1[:6

]print

(list1)

列印列表,發現資料未按行分組儲存

​ 首先,我將新列表拆分6個列表。為什麼要拆分6個列表?因為原網頁中資料是分6列儲存。

new=

new1=

new2=

new3=

new4=

new5=

i=9j=10

k=11

m=12

n=13

o=14

def show_list(num,listnum):

while num<213:

num+=6

print(listnum)

show_list(i,new)

show_list(j,new1)

show_list(k,new2)

show_list(m,new3)

show_list(n,new4)

show_list(o,new5)

​ **執行結果:

​ 然後,將6個列表以**中的行分組合併。

["指標名稱"

,"本月絕對量"

,"本月增長"

,"本月止累計絕對量"

,"本月止累計增長"])

​ 我因一節網易雲課堂,才接觸到python網路爬蟲的內容。我也隔了很長時間,根據網易雲課堂的課完成第一次自我實現python爬蟲專案。對於網路爬蟲了解甚少,本專案有一些不足。不足比如說本專案實現過程時,儲存資料的過程略微麻煩。情各位多加指導!本專案也是參考一些csdn博主的博文,也非常感謝這些博主的支援。

Python 爬蟲(獲取小說)

以 筆趣閣 為例 需求 python3版本以上 安裝方法如下 先安裝python3 pip,然後檢查下版本,如果版本可以公升級,就 upgrade pip 一下,然後再安裝beautifulsoup4 sudo apt get install python3 pip pip3 version pip...

python爬蟲隨機獲取User Agent

剛剛學習python爬蟲的小夥伴們應該面臨反爬問題,那麼初步解決辦法除了 ip還有就是隨機生成ua 今天給大家推薦兩種隨機生成ua的方法,廢話不多說了,直接上 第一種 1.匯入random模組 importrandom list 3.使用random.choice list 隨機獲取列表中的乙個ua...

Python爬蟲學習 獲取網頁

通過get請求獲取返回的網頁,其中加入了user agent資訊,不然會丟擲 http error 403 forbidden 異常,因為有些 為了防止這種沒有user agent資訊的訪問,會驗證請求資訊中的useragent 它的資訊包括硬體平台 系統軟體 應用軟體和使用者個人偏好 如果user...