pandas入門 loc與iloc函式

2022-05-04 17:39:09 字數 990 閱讀 2823

import pandas as pd

import numpy

# 匯入資料

df = pd.read_csv(filepath_or_buffer="d:")

df_new = df.set_index(["country"])

df_new.loc[list(["canada"])] # 1

df_new.loc[df_new["duration"]>160] # 2

df_new.loc[((df_new["duration"] > 200) & (df_new["director_facebook_likes"] > 300 )),"flage"] =1 # 3

df_new.loc[df_new["duration"].isin([100])] # 4

df_new.query("duration > 100 & index == 'uk'") # 5

1:根據列中的元素,選取對應元素的資料集 

2:根據元素的選取條件來選取對應的資料集 

3:根據元素的選取條件來來選取對應的資料集,並在符合條件的資料行新增flage標籤 

4:isin函式是series用來判斷值是否在目標值是否在series 

5:query函式中用來判斷條件符合的資料集並返回

df_new.iloc[0:4]

iloc比較簡單,它是基於索引位來選取資料集,0:4就是選取 0,1,2,3這四行,需要注意的是這裡是前閉後開集合

使用標籤選取資料:

df.loc[行標籤,列標籤]

df.loc['a':'b']#選取ab兩行資料

df.loc[:,'one']#選取one列的資料

df.loc的第乙個引數是行標籤,第二個引數為列標籤(可選引數,預設為所有列標籤),兩個引數既可以是列表也可以是單個字元,如果兩個引數都為列表則返回的是dataframe,否則,則為series。

pandas中loc和iloc方法

我們建立乙個dataframe import numpy as np import pandas as pd df pd.dataframe np.arange 16 reshape 4,4 index list abcd columns list abcd in df out a b c d a ...

pandas 中關於loc跟iloc總結

1 兩者對行的處理區別 pandas.loc 1 5 跟pandas.loc 0 4 取出來的資料是一樣的,這是因為,它是先對資料給定標籤,pandas.loc 1 5 是指從1開始給定標籤,pandas.loc 0 4 是指從0開始給定標籤。同理 pandas.iloc 1 5 也是一樣的。兩者在...

pandas的索引問題(iloc和loc)

loc指的是定位索引,英文意思是loction iloc指的是數字定位索引,int location表示這個只能通過整數索引來取出元素 取出指定的某幾行,或某幾列 這個方法是在需要取出特定的行或者列的時候用,行或者列可以不填,預設選擇是全部行或者全部列 區域選擇 這個方法是比較常用的選擇子區域的方法...