pandas入門學習一

2021-07-30 12:38:32 字數 2376 閱讀 2168

本文是學習《利用python進行資料分析》的部分筆記,在這裡感謝作者。

一:匯入pandas

from pandas import series,dataframe

>>> import pandas as pd
二,series的有關介紹

series類似於一維陣列,它由一組資料以及一組與之相關的索引組成。由一組資料產生

obj=series([4,7,-5,3])
>>> obj

0 4

1 7

2 -5

3 3

dtype: int64

可以在建立的過程中指定索引內容:

obj=series([4,7,-5,3],index=['d','b','a','c'])

>>> obj

d 4

b 7

a -5

c 3

values屬性可以獲得陣列值,index屬性獲得索引值:

>>> obj.values

array([ 4, 7, -5, 3], dtype=int64)

>>> obj.index

index(['d', 'b', 'a', 'c'], dtype='object')

numpy陣列可進行的操作,如根據布林型陣列進行過濾,標量乘法,應用數學函式等都會保留索引與值之間的連線。

>>> obj[obj>2]

d 4

b 7

c 3

可以用in判斷元素是否在series中。

'b' in obj

true

可以通過字典建立series:

>>> sdata=

>>> obj3=series(sdata)

>>> obj3

ohio 35000

oregon 16000

texas 71000

utah 5000

傳入字典的鍵作為索引,會自動匹配,不存在的為nan

>>> states=['california','ohio','oregon','texas']

>>> obj4=series(sdata,index=states)

>>> obj4

california nan

ohio 35000.0

oregon 16000.0

texas 71000.0

在這個例子中,sdata中跟states索引相匹配的三個值會找出並放在相應的位置上。

pandas的isnull和notnull函式可用於檢測缺失值

pd.isnull(obj4)

california true

ohio false

oregon false

texas false

dtype: bool>> >

pd.notnull(obj4)

california false

ohio true

oregon true

texas true

dtype: bool>> >

series最重要的功能是,他在算術運算中會自動對其不同索引的資料

obj3+obj4

california nan

ohio 70000.0

oregon 32000.0

texas 142000.0

utah nan

dtype: float64

series的索引可以通過賦值的方式直接修改:

obj

d 4

b 7

a -5

c 3

dtype: int64>> >

obj.index=['bob','steve','jeff','ryan']

>>> obj

bob 4

steve 7

jeff -5

ryan 3

入門學習(二)Pandas

import pandas as pd import numpy as nytrucks data trucks print trucks 所得如下 1712 before back yes daylight 2613 after back yes daylight 3192 before forw...

pandas入門學習01

pandas底 層是numpy,pandas的操作 pandas.read csv 目錄檔案 讀取csv格式的檔案 pandas裡面字元型是object,不是string pandas.read csv 目錄檔案 head x 大致顯示內容,x可以指定也可以不指定,如果指定則顯示x行 pandas....

pandas 最全入門學習筆記

方法 讀取csv read csv 引 讀取excel read excel 讀取製表符分割的table read table 引數 encoding 設定檔案編碼 header 設定表頭 sep 設定分割符,sep可以是正規表示式 names 設定列名 index col 設定行索引,可以是多個列...