pandas庫loc和iloc函式解釋

2021-10-17 11:14:11 字數 955 閱讀 5951

import pandas as pd

import numpy

# 匯入資料

df = pd.read_csv(filepath_or_buffer="d:") df_new = df.set_index(["country"]) df_new.loc[list(["canada"])] # 1 df_new.loc[df_new["duration"]>160] # 2 df_new.loc[((df_new["duration"] > 200) & (df_new["director_facebook_likes"] > 300 )),"flage"] =1

# 3 df_new.loc[df_new["duration"].isin([100])] # 4 df_new.query("duration > 100 & index == 'uk'") # 5

1:根據列中的元素,選取對應元素的資料集 

2:根據元素的選取條件來選取對應的資料集 

3:根據元素的選取條件來來選取對應的資料集,並在符合條件的資料行新增flage標籤 

4:isin函式是series用來判斷值是否在目標值是否在series 

5:query函式中用來判斷條件符合的資料集並返回

df_new.iloc[0:4]

iloc比較簡單,它是基於索引位來選取資料集,0:4就是選取 0,1,2,3這四行,需要注意的是這裡是前閉後開集合

使用標籤選取資料:

df.loc[行標籤,列標籤]

df.loc['a':'b']#選取ab兩行資料

df.loc[:,'one']#選取one列的資料

df.loc的第乙個引數是行標籤,第二個引數為列標籤(可選引數,預設為所有列標籤),兩個引數既可以是列表也可以是單個字元,如果兩個引數都為列表則返回的是dataframe,否則,則為series。

pandas中loc和iloc方法

我們建立乙個dataframe import numpy as np import pandas as pd df pd.dataframe np.arange 16 reshape 4,4 index list abcd columns list abcd in df out a b c d a ...

pandas的索引問題(iloc和loc)

loc指的是定位索引,英文意思是loction iloc指的是數字定位索引,int location表示這個只能通過整數索引來取出元素 取出指定的某幾行,或某幾列 這個方法是在需要取出特定的行或者列的時候用,行或者列可以不填,預設選擇是全部行或者全部列 區域選擇 這個方法是比較常用的選擇子區域的方法...

pandas入門 loc與iloc函式

import pandas as pd import numpy 匯入資料 df pd.read csv filepath or buffer d df new df.set index country df new.loc list canada 1 df new.loc df new durat...