學習筆記 Pandas(二)

2021-10-05 16:42:31 字數 1893 閱讀 1720

選擇資料

1、loc:通過行和列的名字來獲取值

注意:iloc使用索引定位時,會按照索引規則取值,如[1:5]會取出1,2,3,4這4個值

loc按照label標籤取值,如[『a』:『c』]則a,b,c都取到

3、at:通過行列標籤獲得指定值(獲得單個資料)

4、iat:通過行列標籤的整數索引來選取指定值

5、布林型別的陣列:通常用於篩選符合某些條件的行

處理丟失資料

1、dropna(axis=0, how=『any』, thresh=none, subset=none, inplace=false) #預設丟棄含有缺失值的行

引數說明:

axis:軸。0或』index』,表示按行刪除;1或』columns』,表示按列刪除。

how:篩選方式。『any』,表示該行/列只要有乙個以上的空值,就刪除該行/列;『all』,表示該行/列全部都為空值,就刪除該行/列。

thresh:非空元素最低數量。int型,預設為none。如果該行/列中,非空元素數量小於這個值,就刪除該行/列。thresh=n保留至少有n個非nan資料的行

subset:子集。列表,元素為行或者列的索引。如果axis=0或者『index』,subset中元素為列的索引;如果axis=1或者『column』,subset中元素為行的索引。由subset限制的子區域,是判斷是否刪除該行/列的條件判斷區域。

inplace:是否原地替換。布林值,預設為false。如果為true,則在原dataframe上進行操作,返回值為none。

引數說明:

value:被填充的資料

method:填充的方式,backfill,bfill,pad,ffill

limit:限制填充個數

3、.isnull()判斷是否有控制,多用於整體檢驗

.isnan()多用於單個值的檢驗

注意1、np.nan不是乙個空物件,用i is none 判斷是false

2、對某個值是否為空值進行判斷,只能哦那個np.isnan(i)

3、np.nan非空物件,型別為float

匯入匯出

參考官方教程

合併

Pandas學習筆記(二)

注意講述如何獲取乙個dataframe的某些行和某些列 注意value count 0方法,可以利用這個函式獲知某一列的各個取值的個數 主要講述如何按照人為設定的條件去選取dataframe的部分行和部分列。示例語句 is noise complaints complaint type noise ...

pandas基礎學習筆記二

二 多級索引 三 索引設定 3.set index和reset index 4.rename axis和rename 四 常用索引型函式 五 重複元素處理 六 抽樣函式 第2章 索引.ipynb 寫在前面的,按照教程中的內容都在電腦上敲了一遍 但還是感覺雲裡霧裡的。知識點很多,也有很多經驗的傳授,回...

pandas學習筆記

import numpy as np import pandas as pd obj2 pd.series 4,7,5,3 index d b a c obj2 out 99 d 4 b 7 a 5 c 3 dtype int64 a b pd.series a bout 102 a 1 b 2 c...