初探pandas 安裝和了解pandas資料結構

2021-10-07 18:04:30 字數 3699 閱讀 7185

通過python pip安裝pandas

pip install pandas
pandas常用資料結構包括:series和dataframe

series是一種一維的陣列型物件,包含乙個值序列(與numpy中的資料型別相似),資料標籤(稱為索引(index))。

import pandas as pd

# 建立series物件

obj=pd.series([4

,5,6

,7])

print

(obj)

0    4

1 5

2 6

3 7

dtype: int64

左邊為索引,右邊為值,預設索引從0到n-1(n為資料長度),可以通過values屬性和index屬性分別獲得series物件的值和索引

print

(obj.values)

array([4, 5, 6, 7], dtype=int64)
print

(obj.index)

rangeindex(start=0, stop=4, step=1)
# 自定義索引序列

obj2=pd.series([4

,5,6

,7],index=

['a'

,'b'

,'d'

,'e'])

print

(obj2,

'\n'

)# 輸出索引

print

(obj2.index)

a    4

b 5

d 6

e 7

dtype: int64

index(['a', 'b', 'd', 'e'], dtype='object')

series物件可以使用標籤來進行索引

# 輸出索引為b的元素

print

(obj2[

'b']

)# 輸出索引為a,d,e的元素

print

('* '*10

)print

(obj2[

['a'

,'d'

,'e']]

)

5

* * * * * * * * * *

a 4

d 6

e 7

dtype: int64

series物件也能使用布林值進行過濾

# 輸出值大於5的元素

print

(obj2[obj2>5]

)

d    6

e 7

dtype: int64

dataframe表示矩陣的資料表,包含已排序的列集合,每一列可以是不同的的值型別(數值、字串、布林值等)

dataframe既有行索引,也有列索引,可以被視為乙個共享相同索引的series的字典

# 建立dataframe物件

data=

frame=pd.dataframe(data)

print

(frame)

age name  height

0 18 a 180

1 18 b 180

2 18 c 180

3 20 aa 182

4 20 bb 182

5 20 cc 182

dataframe也可以用columns引數指定列索引順序排列

frame=pd.dataframe(data,columns=

['name'

,'age'

,'height'])

print

(frame)

name  age  height

0 a 18 180

1 b 18 180

2 c 18 180

3 aa 20 182

4 bb 20 182

5 cc 20 182

如果傳的列引數不在字典中,將會出現缺失值

frame=pd.dataframe(data,columns=

['name'

,'age'

,'height'

,'addition'])

print

(frame)

print

(frame.columns)

name  age  height addition

0 a 18 180 nan

1 b 18 180 nan

2 c 18 180 nan

3 aa 20 182 nan

4 bb 20 182 nan

5 cc 20 182 nan

index(['name', 'age', 'height', 'addition'], dtype='object')

dataframe的一列可以按字典型標記或屬性那樣索引為series

frame=pd.dataframe(data,columns=

['name'

,'age'

,'height'])

print

(frame[

'name'])

print

(frame.age)

0     a

1 b

2 c

3 aa

4 bb

5 cc

name: name, dtype: object

0 18

1 18

2 18

3 20

4 20

5 20

name: age, dtype: int64

行也可以通過位置或特殊屬性loc進行索引

frame=pd.dataframe(data,columns=

['name'

,'age'

,'height'])

print

(frame.loc[2]

)

name        c

age 18

height 180

name: 2, dtype: object

初探pandas 安裝和了解pandas資料結構

通過python pip安裝pandas pip install pandaspandas常用資料結構包括 series和dataframe series是一種一維的陣列型物件,包含乙個值序列 與numpy中的資料型別相似 資料標籤 稱為索引 index import pandas as pd 建立...

初探pandas 索引和查詢資料

利用pandas查詢資料 import pandas as pd ser pd.series range 0 10,2 print ser 0 0 1 2 2 4 3 6 4 8 dtype int64通過index檢視索引值 print ser.index rangeindex start 0,s...

Python資料分析Pandas庫資料結構 一

import pandas as pd import numpy as np s pd.series 1,2,3,4,np.nan,9,9 s2 pd.date range 20181201 periods 6 periods週期 import pandas as pd import numpy a...