Pandas查詢資料的5種方法

2021-10-23 08:33:05 字數 1840 閱讀 5114

按數值,列表,函式,區間,條件的查詢方法

1.df.loc:根據行列的標籤值進行查詢

2.df.iloc:根據行列的位置進行查詢

3.df.where

4.df.query

@用單個lable值查詢資料

@使用值列表批量查詢

@使用資料區間進行範圍查詢

import pandas as pd

df=pd.read_csv(

"檔案位置"

)df.head#檢視檔案前幾行資料

df.set_index(

'列名索引'

,implace=

true

)df.index#索引資料

df.head#輸出的是對應改索引為第一列,每行為改索引資料

df.loc[:,

'bwendu'

]= df[

'bwendu'].

str.replace(

"c","")

.astype(

"int32"

)#將溫度裡面的c替換成空白

#根據單個lable值查詢資料

df.loc[

'前面索引資料值(lable)'

,'需要查詢的列名索引'

]df.loc[

'前面索引資料值(lable)',[

'需要查詢的列名索引'

,'需要查詢的列名索引'

,'需要查詢的列名索引']]

#根據值列表批量查詢

df.loc[

['前面索引資料值(lable)'

,'前面索引資料值(lable)'

,'前面索引資料值(lable)'],

['需要查詢的列名索引'

,'需要查詢的列名索引'

,'需要查詢的列名索引']]

#使用數值區間查詢

df.loc[

'前面索引資料值(lable)'

:'前面索引資料值(lable)'

,'需要查詢的列名索引'

:'需要查詢的列名索引'

]#使用條件查詢

df.loc[df[

"需要查詢的列名索引"

]<-10

,:]#觀察下這列的布林條件

df["需要查詢的列名索引"

]<-10

#組合條件查詢

df.loc[

(df[

"需要查詢的列名索引"

]<

-110)&

(df[

"需要查詢的列名索引"]==

10)&(df[

"需要查詢的列名索引"]==

'晴'),:

]#呼叫函式查詢

#方式一

df.loc[lamba df :

(df[

"需要查詢的列名索引"

]<=30)

&(df[

"需要查詢的列名索引"

]>=15)

,:]#方式二

defquery_my_data

(df)

:return df.index.

str.startswith(

"前面索引資料值(lable)#由於是str,可以不完整資料值"

)&df[

"需要查詢的列名索引"]==

1df.loc[query_my_data,

:]

pandas提取資料的6種方法

pandas是python資料分析必備工具,它有強大的資料清洗能力,往往能用非常少的 實現較複雜的資料處理。import pandas as pd data pd.read excel 超市運營資料模板.xlsx 第一種方法,用比較運算子 data data.性別 男 第二種方法,用比較函式 eq ...

加快 hive 查詢的 5 種方法

1.使用 tez set hive.execution.engine tez 2.使用 orcfile。當有多個表 join 時,使用 orcfile 進行儲存,會顯著地提高速度。create table a orc customerid int,name string,age int,addres...

匯出hive表資料的5種方法

下面介紹一下hive 匯出的幾種方式 本地檔案直接匯出 insert overwrite local directory data hive export student info select from default.student修改分隔符和換行符 insert overwrite local...