大資料Python基礎之Series資料結構學習

1.series是在pandas庫**現的資料結構，適用於科學計算。

每個series物件實際上都有兩個互相關聯的陣列組成，其中主陣列用來存放資料，主陣列的每個元素都有乙個與之相關聯的標籤，這些標籤儲存在另乙個叫作index的陣列中，如果不指定索引，預設生成的索引是0到n-1。通過series物件的values和index屬性分別獲得對應的值和索引。

import pandas as pd
obj = pd.series([6, 2, -2, 0])
print obj
print obj.dtype
print obj.values
print obj.index

輸出：

0 61 2

2 -2

3 0int64

[ 6 2 -2 0]

array([0, 1, 2, 3], dtype=int64)

2.建立series

# 利用實數
a = pd.series(3, index=list("abc"))
# 利用列表
b = pd.series(list("he"))
# 利用元組
c = pd.series(tuple("he"))
# 利用ndarray陣列
d = pd.series(np.zeros(3))
# 利用字典
e = pd.series()
print a, '\n', b, '\n', c, '\n', d, '\n', e, '\n'

輸出：

a 3b 3

c 30 h

1 e0 h

1 e0 0

1 02 0

age 12

name wang

3.series與字典的關係

series不僅可以從字典建立，也可以認為series是乙個長度固定且有序的字典。series將索引值和資料值按位置配對，在使用字典的上下文中都可以使用series，通過字典生成series，預設自動排序，也可以指定索引順序。沒有資料的補nan，沒有索引的排除。

4.series物件屬性

series的name屬性。索引的name屬性，索引值也可以通過賦值方式改變。

aa = pd.series([1, 2, 3], index=list("abc"))
aa.name = "newname"
aa.index.name = "newindex"
aa.index =["aa", 'bb', 'cc']
print aa

輸出：

aa 1

bb 2

cc 3

name: newname

5.series物件的numpy風格操作

series本質上是乙個numpy的陣列，因此numpy的陣列處理函式可以直接對series進行處理。可以使用布林值陣列進行過濾，與標量相乘，應用數學函式，索引值不會參與運算。

o = pd.series([1, 2, -1, 0])
print o*2
print o[o > 0]
print np.exp(o)

輸出：

0 21 4

2 -2

3 00 1

1 20 2.718282

1 7.389056

2 0.367879

3 1.000000

大資料Python基礎之Series資料結構學習

大資料Python基礎之檔案讀寫

python大資料 numpy基礎

大資料基礎

大資料Python基礎之Series資料結構學習

大資料Python基礎之檔案讀寫

python大資料 numpy基礎

大資料基礎

相關推薦