Python資料分析之Pandas篇

2021-10-09 15:12:57 字數 1997 閱讀 3999

windows下pip安裝pandas:

pip install pandas

執行環境

先導入pandas模組:

import pandas as pd

1.1 宣告series物件(以下**皆在ipython中演示)

呼叫series()建構函式,建立series物件

呼叫構造建構函式series()時可以指定index,標籤可以為字串型別

使用index(索引)和values(元素)兩個屬性分別檢視組成series物件的兩個陣列

2.2選擇內部元素

指定鍵或定位於索引位置的標籤獲取series物件內部元素

使用切片或者元素對應的標籤選擇多個元素

1.3為元素賦值用索引或者標籤選取元素進行賦值

1.4使用numpy陣列或其他新的series物件定義新series物件

這裡注意修改arr的元素值series物件c的元素值也會改變

1.5篩選元素

根據條件篩選元素

1.6 series物件運算和數學函式

適用於numpy陣列的運算子(+、-、*、/)或其他數學函式也適用於series物件。運算子可直接用來編寫算術表示式

1.7 series物件的組成元素

series物件往往包含重複的元素,以下是對重複元素的一些處理

使用unique()函式返回乙個包含series去重後元素的陣列

value_counts()函式不僅返回各個不同的元素,還計算每個元素在series**現的次數。

isin()函式判斷所屬關係,返回布林值,可用於篩選series或dataframe列中的資料

1.8 nan(not a number)非數值

資料結構中若字段為空或者不符合數字的定義時,可用這個特定的值來表示,建立資料結構時,可為陣列中元素缺失的缺失項輸入np.nan。一般來講nan值表示資料有問題,必須對其進行處理,尤其是在資料分析時。

isnull()和notnull()函式適合用來識別沒有對應元素的索引。物件的元素對應的時nan,isnull()函式返回值為true,反之為false;notnull()函式與isnull函式用法相反。

這兩個函式還可以作為篩選條件

1.9 series用作字典

可以把series物件當作字典(dictionary)來用,可以事先定義好字典類建立series物件。

1.10 series物件之間的運算

運算後會得到乙個新的series物件,其中支隊標籤相同的元素求和,其他屬於任何乙個series物件的標籤也被新增到新物件中,只不過過它的值均為nan。

Python之資料分析(寶可夢資料分析)

在此感謝阿里雲天池平台提供的學習平台,並提供相應的教程供小白們學習資料分析。seaborn庫 seaborn 是基於 python 且非常受歡迎的圖形視覺化庫,在 matplotlib 的基礎上,進行了更高階的封裝,使得作圖更加方便快捷。即便是沒有什麼基礎的人,也能通過極簡的 做出具有分析價值而又十...

python資料分析之Numpy

numpy系統是python的一種開源的數值計算擴充套件 ndarray 多維陣列 所有元素必須是相同型別 ndim屬性,維度個數 shape屬性,各維度大小 dtype屬性,資料型別 coding utf 8 import numpy as np 生成指定維度的隨機多維資料 data np.ran...

Python 資料分析之scipy

scipy是一組專門解決科學計算中各種標準問題域的包的集合,主要包括下面這些包 匯入積分模組 import numpy as np 匯入numpy庫 from scipy import integrate 匯入定積分模組scipy.integrate.quad func,a,b 計算單重積分,引數分...