pandas讀書筆記

2021-07-10 13:48:26 字數 2141 閱讀 4495

類似一維陣列的物件,資料(numpy資料型別)和相關的標籤

obj = series([4, 7, -5, 3])

obj.index

obj.values

# 指定索引

obj2 = series([4, 7, -5, 3], index=['d','b','a','c'])

obj2.index

obj2['a']

obj2[['a','d','c']]

# numpy陣列運算都會保留索引和值之間的鏈結

obj2[obj2>0]

obj2*2

np.exp(obj2)

# 可以看做乙個定長的有序字典

'b'in obj2

# 如果資料存在python字典中,可以通過字典來建立series

sdata =

obj3 = series(sdata)

states = ['california', 'ohio', 'oregon', 'texas']

obj4 = series(sdata, index=states)

pd.isnull(obj4)

pd.notnull(obj4)

obj4.isnull()

# series物件本身及其索引都有乙個name屬性

obj4.name = 'population'

obj4.index.name = 'state'

# series索引可以通過賦值就地修改

obj.index = ['bob', 'steve', 'jeff', 'ryan']

**型的資料結構,它含有一組有序的列,每列可以是不同的值型別

# 構建dataframe

# 最常用直接傳入乙個由等長列表或numpy陣列組成的字典

data =

# 結果會自動加上索引

frame = dataframe(data)

# 如果指定了列序列

frame = dataframe(data, columns=['year','state','pop'])

# 和series一樣,如果傳入的列在資料中找不到,產生nan

frame2 = dataframe(data, columns=['year', 'state', 'pop', 'debt'], index=['one','two','three','four','five'])

frame2.columns

# 通過類似字典標記的方式或屬性的方式,可以將dataframe的列獲取為series

frame2['state']

frame2.year

# 行獲取

frame2.ix['three']

# 列可以通過賦值的方式修改

frame2['debt'] = 16.5

frame2['debt'] = np.arange(5.)

# 將列表或陣列賦值給某個列時,長度必須匹配,如果賦值的是series,會精確匹配索引

val = series([-1.2, -1.5, -1.7], index = ['two', 'four', 'five'])

frame2['debt'] = val

# 為不存在的列賦值,會建立新列

frame2['eastern'] = frame2.state == 'ohio'

# del 刪除列

del frame2['eastern']

#### 通過索引方式返回的列都是相應資料的檢視,不是副本

# 另一種常見的資料形式:巢狀字典。外層鍵:列,內層鍵:索引

pop = ,

'ohio':}

frame3 = dataframe(pop)

# 對結果進行轉置

frame3.t

# 內層字典的鍵會被合併、排序形成最終的索引,如果顯式指定了索引則不會這樣

dataframe(pop, index=[2001,2002,2003])

# index 和 columns的 name屬性

frame3.index.name = 'year'

frame3.columns.name = 'state'

frame3.values

pandas資料分析讀書筆記(二)

pd.isnull df 返回空的值為true,非空值為false 最常用的資料載入函式有 read csv 與read table pd.read table sep 如果是csv檔案,也可以用read table函式來讀取,只是需要設定分隔符sep pd.read csv header none...

讀書筆記一 pandas資料結構介紹

pandas資料結構介紹 主要兩種資料結構 series和dataframe.series series是一種類似於一維陣列的物件,由一組資料 各種numpy資料型別 資料標籤 即索引 組成。直接傳入一組資料 from pandas import series,dataframe obj serie...

mysql運維 讀書筆記 Mysql 讀書筆記

mysql儲存時間有兩種型別 datetime和timestamp。分別說一下兩者的區別。datetime,以8位元組儲存時間,理論上可以從0000年儲存到9999年。並且沒有時區的概念,它儲存的就是乙個時間點的概念。timestamp和datetime最主要的不同就是,它是以4個位元組儲存,由19...