pandas (五)資料選取

2021-10-06 15:02:23 字數 1759 閱讀 2912

# 迭代器及使用

for idx,row in df.iterrows(

): row[

'id'

]

# 迭代器對每個元素進行處理

df.loc[i,

'鏈結'

]= f''

for i in df.name:

print

(i)# 迭代乙個列

# 按列迭代,[列名, 列中的資料序列 s(索引名 值)]

for label, content in df.items():

print

(label, content)

# 按行迭代,迭代出整行包括索引的類似列表的內容,可row[2]取

for row in df.itertuples():

print

(row)

df.at[

2018

,'總人口'

]# 按行列索引名取乙個指定的單個元素

df.iat[1,

2]# 索引和列的編號取單個元素

s.nlargest(5)

.nsmallest(2)

# 最大和最小的前幾個值

df.nlargest(3,

['population'

,'gdp'])

df.take([0

,3])

# 指定多個行列位置的內容

# 按行列擷取掉部分內容,支援日期索引標籤

ds.truncate(before=

2, after=

4)

# 將 dataframe 轉成 series

df.iloc[:,

0]float

(str

(val)

.rstrip(

'%')

)# 百分數轉數字

df.reset_index(inplace=

true

)# 取消索引

df[col]

# 根據列名,並以series的形式返回列

df[[col1, col2]

]# 以dataframe形式返回多列

df.loc[df[

'team']==

'b',

['name']]

# 按條件查詢,只顯示name 列

s.iloc[0]

# 按位置選取資料

s.loc[

'index_one'

]# 按索引選取資料

df.loc[0,

'a':

'b']

# a到 b 欄位的第一行

df.loc[

2018

:1990

,'第一產業增加值'

:'第三產業增加值'

]df.loc[0,

['a'

,'b']]

# d.loc[位置切片, 字段]

df.iloc[0,

:]# 返回第一行, iloc 只能是數字

df.iloc[0,

0]# 返回第一列的第乙個元素

dc.query(

'site_id > 8 and utype=="老客"'

).head(

)# 可以 and or / & |

Pandas資料的選取

使用python的工具包pandas,可以方便的處理資料。但是發現乙個問題 有時候總是不知道怎麼選取資料。因此在這裡記錄一下。由於在實際使用中,主要用到的就是dataframe的結構,因此,這裡主要說dataframe資料結構中,資料的選取方法。假設我們已經有了dataframe資料,呈現如下結構 ...

pandas 資料索引與選取

我們對 dataframe 進行選擇,大抵從這三個層次考慮 行列 區域 單元格。其對應使用的方法如下 一.行,列 df 二.區域 df.loc,df.iloc,df.ix 三.單元格 df.at,df.iat 下面開始練習 import numpy as np import pandas as pd...

Pandas中根據列的值選取多行資料

選取等於某些值的行記錄 用 df.loc df column name some value 選取某列是否是某一型別的數值 用 isin df.loc df column name isin some values 多種條件的選取 用 df.loc df column some value df o...