pandas 資料型別 Series

2021-10-10 13:28:25 字數 2088 閱讀 7393

首先載入庫

import numpy as np

import pandas as pd

python list列表建立series

a = pd.series([1,2,3,4]) #預設索引

b = pd.series([1,2,3,4],index=['a','b','c','d']) #自定義索引

s = pd.series([true,1,2.3,'a','你好']) #資料型別

標量值建立series

c = pd.series(10,index=['a','b','c']) #必須帶index
python字典建立series

d = pd.series()
ndarray建立series,索引和資料都可以通過ndarray型別生成

n = pd.series(np.arange(5))

m = pd.series(np.arange(5),index=np.arange(9,4,-1))

其他函式建立series

n = pd.series(range(10))
index和value操作

b = pd.series([9,8,7,6,5,4,3],['a','b','c','d','e','f','g'])

bb.index # 獲得索引,輸出index型別,就是pandas獨有的索引型別

b.values # 獲得資料,輸出型別為array,就是np的array陣列

# 索引

b['b']

b[1] # 與上面相同,自動索引是預設生成的,和自定義索引並存

b.bb[['c','d','a']]

b[['c','d',0]] #錯誤,兩套索引並存,但不能混用

# 切片

b[:'d']

b['d':]

b[:3]

b[::2]

b[::-1]

類ndarray操作

b[3] #第3個值,結果是索引的值

b[:3] #0-3,結果還是series型別

b[b > b.median()] #所有大於中位數的值

類python字典的操作

b['b']

'c' in b #判斷此鍵在不在b的索引中

0 in b #in 不會判斷自動索引

b.get('f',100) #從b中提取索引f的值,如果存在就取出,不存在就用 100 代替

根據索引對齊操作

series + series

a = pd.series([1,2,3],['c','d','e'])

b = pd.series([9,8,7,6],['a','b','c','d'])

a + b #結果為兩個值的並集,相加時索引對齊加值,索引不對齊的沒值,加完也沒值

series物件和索引都可以起乙個名字,儲存在屬性.name中

b = pd.series([9,8,7,6],['a','b','c','d'])

b.name #預設沒有

b.name = 'series物件' #物件命名

b.index.name = '索引列' #索引命名

b

series物件可以隨時修改並立即生效

b['a'] = 15

b.name = 'series'

bb.name = 'new series'

b['b','c'] = 20 # b[['b','c']] = 20

b

pandas 檢視資料的基本資訊 Series 篇

s.describe 描述性統計資訊 s.index 標籤 s.index.values 標籤 s.values 資料 s.to numpy 資料 推薦 s.head n 前n個 s.tail n 尾n個 s.memory usage 占用記憶體 位元組b s.name 名字 s.dtype 型別s...

Pandas的DataFrame資料型別

pandas的dataframe資料型別 縱軸表示不同索引axis 0,橫軸表示不同列axis 1 dataframe型別建立 1.從二維ndarray物件建立 import pandas as pd import numpy as np d pd.dataframe np.arange 10 re...

pandas 一 Series資料型別

二維資料 高維資料 series由一組資料與資料的索引組成的資料 aa pd.series 1,2,3,4,5 011 2233 445pd.series 1,2,3,4,5 index a b c d e a 1 b 2 c 3 d 4 e 5pd.series 2 index a b c a 2...