Pandas學習（一）建立，基本方法

data = pd.series([0.25, 0.5, 0.75, 1.0])
print(data.index) #返回索引
print(data.values) #返回資料

自定義索引：

data = pd.series([0.25, 0.5, 0.75, 1.0],index=['a', 'b', 'c', 'd'])

pd.series(
[2, 4, 6]
)

pd.series(5, index=
[100, 200, 300]
)#自動填充，指定索引值

pd.series(
) pd.series(
, index=
[3, 2]
)#指定索引篩選需要的結果

dataframe是乙個**型的資料結構，既有行索引，也有列索引，可以看作由series物件組成的字典

b = pd.dataframe(
, columns=
['name', 'age'])
print(b.values)
#返回二維形式的陣列，如果資料型別不一樣，那麼會自動向上轉換成可以相容所有資料的型別
print(b.columns)
print(b.index)

## 2.建立
## 01.由含有等長列表的字典來建立
```bash
b = pd.dataframe(, columns=[
'name', 'age'], index=['one', 'two', 'three'])
print(b)#columns指定列的順序,index指定行索引名稱

population=pd.series(
['1000','3000','2000'])
area=pd.series(
['a','b','c'])
pd.dataframe(
)

pd.dataframe(np.random.rand(3, 2),columns=
['foo', 'bar'
],index=
['a', 'b', 'c'
])

a = np.zeros(3, dtype=[(
'a', 'i8'
), (
'b', 'f8')]
)print(pd.dataframe(a))

data =
, 'age':}
m = pd.dataframe(dataindex=
['one','two','three'])
#可以指定索引，如果不指定則會自己合併排序
print(m)

獲取列：

b[
'name'
]b.name

獲取行：

b.ix[
'one'
]

利用索引修改值：

c=pd.series(
['女'
],index=
['one'])
#指定修改值的列及內容
b['***'
]=c

新增新列並賦值：

b[
'height']=
['170','160','180'
]print(b)

構建陣列或者dataframe物件時，所用到的標籤都會轉換成乙個index物件，它不可修改。

method可選引數為

ffill :向前填充

bfill :向後填充

a.reindex(index,columns)   #a不會發生變化，生成了乙個新的物件
a.ix(index,columns) #index和columns都必須是原有的索引

a.drop(
[index]
)#丟棄指定行
a.drop(
,axis=1)
#丟棄指定列
示例：
import pandas as pd
b = pd.dataframe(
, columns=
['name', 'age', '***'
], index=
[5, 4, 3]
)print(b.ix[5:4]
)#行索引5到4
print(b.ix[:2, :1]
)#前兩行，第一列那
print(b.ix[:, 'name'])
#name列所有行
print(b.ix[5]
)#索引為5的行
print(b.xs(
['name'
], axis=1))
#預設axis=0,選取name列
兩個pandas物件進行這些運算時，行和列取並集，所以會有預設值nan來填充交集以外的部分，若想用其他值來填充，則可以通過引數fill_value設定,如方法a.add(b,fill_value)
#對某個軸應用函式
#對a所有元素應用某格式
a[column_name].map(fmt)
#對a的某一列應用某格式
a.sort_index(axis,ascending,by)
#by代表按照某一列或者幾列進行排序，返回的是乙個已排序的物件
a.order(
)#按值排序
a.index.is_unique(
)#判斷索引是否唯一
a.sum(axis,skipna=false)
#skipna是指是否要跳過預設值
a.describe(
)#得到多個匯**計
)#將a中的唯一值篩選出來
a.value_counts(sorted=true)
#計算a中各值出現的次數
mark=a.isin(list)
a[mark]
#篩選a中在list中的值
 Pandas學習筆記一 如何建立Series物件
常見的建立pandas物件的方式，都像這樣的形式 pd.series data,index index 其中，index是乙個可選引數，data引數支援多種資料型別 例如，data可以時列表或numpy陣列，這是index預設值為整數序列 pd.series 2,4,6 out 58 02 1426...
Pandas學習筆記 Pandas概覽（一）
pandas是python的核心資料分析支援庫，提供了快速 靈活 明確的資料結構，旨在簡單 直觀的處理關係型 資料型的資料。pandas適用於處理以下型別的資料 維數名稱描述1 series 帶標籤的一維同構陣列 2dataframe 帶標籤的，大小可變的，二維異構 pandas資料結構就像是低維資...
Pandas的基本操作（一）
世界會向那些有目標和遠見的人讓路。pandas是基於numpy的一種處理資料的工具，一般用於資料預處理與資料分析 import pandas as pd 函式 read csv 用法 pd.read csv 檔名 該函式返回dataframe型別的資料結構，與numpy中的ndarray相似 該資料...

Pandas學習（一） 建立，基本方法

Pandas學習筆記一 如何建立Series物件

Pandas學習筆記 Pandas概覽（一）

Pandas的基本操作（一）

相關推薦

Pandas學習（一）建立，基本方法

Pandas學習筆記一如何建立Series物件