Pandas學習(一) 建立,基本方法

2021-10-23 04:45:20 字數 3932 閱讀 8819

data = pd.series([0.25, 0.5, 0.75, 1.0])

print(data.index) #返回索引

print(data.values) #返回資料

自定義索引:

data = pd.series([0.25, 0.5, 0.75, 1.0],index=['a', 'b', 'c', 'd'])
pd.series(

[2, 4, 6]

)

pd.series(5, index=

[100, 200, 300]

)#自動填充,指定索引值

pd.series(

) pd.series(

, index=

[3, 2]

)#指定索引篩選需要的結果

dataframe是乙個**型的資料結構,既有行索引,也有列索引,可以看作由series物件組成的字典

b = pd.dataframe(

, columns=

['name', 'age'])

print(b.values)

#返回二維形式的陣列,如果資料型別不一樣,那麼會自動向上轉換成可以相容所有資料的型別

print(b.columns)

print(b.index)

## 2.建立

## 01.由含有等長列表的字典來建立

```bash

b = pd.dataframe(, columns=[

'name', 'age'], index=['one', 'two', 'three'])

print(b)#columns指定列的順序,index指定行索引名稱

population=pd.series(

['1000','3000','2000'])

area=pd.series(

['a','b','c'])

pd.dataframe(

)

pd.dataframe(np.random.rand(3, 2),columns=

['foo', 'bar'

],index=

['a', 'b', 'c'

])

a = np.zeros(3, dtype=[(

'a', 'i8'

), (

'b', 'f8')]

)print(pd.dataframe(a))

data =

, 'age':}

m = pd.dataframe(dataindex=

['one','two','three'])

#可以指定索引,如果不指定則會自己合併排序

print(m)

獲取列:

b[

'name'

]b.name

獲取行:

b.ix[

'one'

]

利用索引修改值:

c=pd.series(

['女'

],index=

['one'])

#指定修改值的列及內容

b['***'

]=c

新增新列並賦值:

b[

'height']=

['170','160','180'

]print(b)

構建陣列或者dataframe物件時,所用到的標籤都會轉換成乙個index物件,它不可修改

method可選引數為

ffill :向前填充

bfill :向後填充

a.reindex(index,columns)   #a不會發生變化,生成了乙個新的物件

a.ix(index,columns) #index和columns都必須是原有的索引

a.drop(

[index]

)#丟棄指定行

a.drop(

,axis=1)

#丟棄指定列

示例:

import pandas as pd

b = pd.dataframe(

, columns=

['name', 'age', '***'

], index=

[5, 4, 3]

)print(b.ix[5:4]

)#行索引5到4

print(b.ix[:2, :1]

)#前兩行,第一列那

print(b.ix[:, 'name'])

#name列所有行

print(b.ix[5]

)#索引為5的行

print(b.xs(

['name'

], axis=1))

#預設axis=0,選取name列

兩個pandas物件進行這些運算時,行和列取並集,所以會有預設值nan來填充交集以外的部分,若想用其他值來填充,則可以通過引數fill_value設定,如方法a.add(b,fill_value)

#對某個軸應用函式

#對a所有元素應用某格式

a[column_name].map(fmt)

#對a的某一列應用某格式

a.sort_index(axis,ascending,by)

#by代表按照某一列或者幾列進行排序,返回的是乙個已排序的物件

a.order(

)#按值排序

a.index.is_unique(

)#判斷索引是否唯一

a.sum(axis,skipna=false)

#skipna是指是否要跳過預設值

a.describe(

)#得到多個匯**計

)#將a中的唯一值篩選出來

a.value_counts(sorted=true)

#計算a中各值出現的次數

mark=a.isin(list)

a[mark]

#篩選a中在list中的值

Pandas學習筆記一 如何建立Series物件

常見的建立pandas物件的方式,都像這樣的形式 pd.series data,index index 其中,index是乙個可選引數,data引數支援多種資料型別 例如,data可以時列表或numpy陣列,這是index預設值為整數序列 pd.series 2,4,6 out 58 02 1426...

Pandas學習筆記 Pandas概覽(一)

pandas是python的核心資料分析支援庫,提供了快速 靈活 明確的資料結構,旨在簡單 直觀的處理關係型 資料型的資料。pandas適用於處理以下型別的資料 維數名稱描述1 series 帶標籤的一維同構陣列 2dataframe 帶標籤的,大小可變的,二維異構 pandas資料結構就像是低維資...

Pandas的基本操作(一)

世界會向那些有目標和遠見的人讓路。pandas是基於numpy的一種處理資料的工具,一般用於資料預處理與資料分析 import pandas as pd 函式 read csv 用法 pd.read csv 檔名 該函式返回dataframe型別的資料結構,與numpy中的ndarray相似 該資料...