Pandas基本操作總結 資料篩選loc

2021-10-16 13:37:53 字數 791 閱讀 5925

#1 loc篩選 loc為普遍用法

得到單個值

df.loc["e行","f列"]

df.loc["a行", ["b列", "f列","e列"]]

列表批量查詢

df.loc[ ["a行","b行", "f行"], ["b列", "f列","e列"]]

區間範圍連續查詢

df.loc["a行":"c行", "b列":"c列"]

條件表示式查詢

df.loc[df["c列"]>0, :] #篩選c列》0,顯示滿足條件所有行

組合條件表示式查詢

dfdf.loc[ (df["c列"]>0) & (df["d列"]<1) & (df["e列"].str.contains("優秀")), :]

呼叫lambda函式查詢

df.loc[lambda df: (df["c列"]>0) & (df["d列"]<1), :]

呼叫自定義函式查詢

def query_1(df):

return df.index.str.startwith("2021-01") & df["d列"]<1

df.loc[query_1, :]

#2 iloc

iloc只能接受行標和列表號作為引數,不支援表示式查詢

df.iloc[1, 5] #相當於取具體的單元格資料,相當於iat

df.iloc[2:4, 1:5] #取連續行列資料

df.iloc[[2,4], [1:5]] #取刪選的不連續行列資料

Pandas基本操作

常用技巧 1 讀取檔案 2 初步設定 最大顯示1000行 最大顯示20列 最大精度 3 去重 所有列相同為重複 k1相同為重複,保留最後乙個 預設保留第乙個 4 顯示當前路徑 5 jupyter下畫圖 6 計算運算時間 7 建立新變數 8 刪除乙個變數 9 刪除一行觀測 10 顯示前三行 11 顯示...

pandas基本操作

pd.read csv filename 從csv檔案匯入資料 pd.read excel filename 從excel檔案匯入資料 pd.read sql query,connection object 從sql表 庫匯入資料 pd.read json json string 從json格式的字...

Pandas操作總結

具體操作詳見 鏈結 multiindex series 通過類似字典標記的方式或屬性的方式,可將dataframe的列獲取為乙個series 物件 列名 建立dataframe,修改index和columns 建立日期 行索引,叫index,axis 0 列索引,叫colums,axis 1 物件....