Pandas中loc用法 索引 補全缺失值

2021-08-27 11:09:37 字數 1083 閱讀 7777

loc——通過行標籤索引行資料

loc[1]表示索引的是第1行(index 是整數)

import pandas as pd  

data = [[1,2,3],[4,5,6]]

index = [0,1]

columns=['a','b','c']

df = pd.dataframe(data=data, index=index, columns=columns)

print df.loc[1]

'''''

a 4

b 5

c 6

'''

loc[『d』]表示索引的是第』d』行(index 是字元)

import pandas as pd  

data = [[1,2,3],[4,5,6]]

index = ['d','e']

columns=['a','b','c']

df = pd.dataframe(data=data, index=index, columns=columns)

print df.loc['d']

'''''

a 1

b 2

c 3

'''

實際應用,在補全缺失值時非常有幫助,例如在進行kaggle-titanic比賽的時候,

df.loc[ (df.age.isnull()), 'age' ] = predictedages
使用隨機森林獲得的predictedages 值,填補資料集中age特徵的缺失值,(df.age.isnull())確定行,'age'確定列。

在將cabin特徵進行補全時,同樣處理。

df.loc[ (df.cabin.notnull()), 'cabin' ] = "yes"

df.loc[ (df.cabin.isnull()), 'cabin' ] = "no"

Pandas中loc和iloc函式用法詳解

loc函式 通過行索引 index 中的具體值來取行資料 如取 index 為 a 的行 iloc函式 通過行號來取行資料 如取第二行的資料 本文給出loc iloc常見的五種用法,並附上詳細 1 利用loc iloc提取行資料 import numpy as np import pandas as...

Pandas中loc和iloc函式的用法

loc表示location的意思 iloc中的loc意思相同,前面的i表示integer,所以它只接受整數作為引數。import pandas as pd import numpy as np np.random.randn 5,2 表示返回5x2的矩陣,index表示行的編號,columns表示列...

pandas的索引問題(iloc和loc)

loc指的是定位索引,英文意思是loction iloc指的是數字定位索引,int location表示這個只能通過整數索引來取出元素 取出指定的某幾行,或某幾列 這個方法是在需要取出特定的行或者列的時候用,行或者列可以不填,預設選擇是全部行或者全部列 區域選擇 這個方法是比較常用的選擇子區域的方法...