龍珠天池Python學習計畫Task4

2021-10-25 21:15:39 字數 872 閱讀 7031

利用pandas分析美國選民**喜好。

進行資料處理前,我們需要知道我們最終想要的資料是什麼樣的,因為我們是想分析候選人與捐贈人之間的關係,所以我們想要一張資料表中有捐贈人與候選人一一對應的關係,所以需要將目前的三張資料表進行一一關聯,彙總到需要的資料。

進過資料處理部分,我們獲得了可用的資料集,現在我們可以利用呼叫shape屬性檢視資料的規模,呼叫info函式檢視資料資訊,呼叫describe函式檢視資料分布。

c_itcont.shape,檢視資料規模 多少行 多少列

c_itcont.info(),檢視整體資料資訊,包括每個欄位的名稱、非空數量、欄位的資料型別

通過上面的探索我們知道目前資料集的一些基本情況,目前資料總共有756205行,8列,總占用記憶體51.9+mb,state、employer、occupation有缺失值,另外日期列目前為int64型別,需要進行轉換為str型別。

c_itcont.head(3),檢視資料前3行

c_itcont.describe(),檢視資料表中資料型別的列的資料分布情況

c_itcont[『cand_name』].describe(),檢視單列的資料發布情況

計算前十位黨派和**候選人獲得的捐款總額

不同職業的人捐款的總額,然後排序,取前十位

以及不同捐款人的數量

每個州捐款總額和捐款人的數量

匯入相關python庫

按州總捐款數和總捐款人數柱狀圖

各州捐款總人數視覺化

熱門候選人拜登在各州的獲得的捐贈佔比

總捐最多的候選人捐贈者詞雲圖

總結,其實是利用python的資料功能,分析出資料,再進行視覺化的操作,因為python在計算大資料上方便,如果資料量較小,直接用excel也是一樣可以做出對應的資料分析

Python入門(後傳 天池龍珠計畫) (二

補充內容 對資料型別部分做了更為詳細的介紹,將其區分為簡單資料型別和容器資料型別 序列型別部分新增部分操作函式 列表型別的操作方法部分新增list.extend del list i,j list.sort 函式及其用法 元組型別部分新增解壓元組介紹 字串型別部分新增常用內建方法介紹 對映型別部分新...

天池龍珠計畫Python訓練營 第六天

有幸參加了阿里雲舉辦的天池龍珠計畫python訓練營。收穫頗多。每天記錄一些自己之前的知識盲點,需經常溫習。一 集合 1 集合的建立 在建立空集合的時候只能使用s set 因為s 建立的是空字典。例子 basket set basket.add banana num print type num n...

天池龍珠計畫Python訓練營 第五天

有幸參加了阿里雲舉辦的天池龍珠計畫python訓練營。收穫頗多。每天記錄一些自己之前的知識盲點,需經常溫習。一 字串 1 字串轉換 maketrans intab,outtab 建立字元對映的轉換表,第乙個引數是字串,表示需要轉換的字元,第二個引數也是字串表示轉換的目標。translate tabl...