Pandas 基礎 (4) 彙總和計算描述統計

2021-09-24 23:02:16 字數 3758 閱讀 6888

pandas 物件擁有一組常用的數學和統計方法,他們大部分都屬於約簡和匯**計,用於從 series 中提取單個值(如 sum/mean),或者從 dataframe 的行或列中提取乙個 series。

in [

144]

: df = dataframe([[

1,np.nan],[

2,3]

,[np.nan,np.nan],[

0,2]

],..

.: index=

['a'

,'b'

,'c'

,'d'

],columns=

['one'

,'two'])

in [

145]

: df

out[

145]

: one two

a 1.0 nan

b 2.0

3.0c nan nan

d 0.0

2.0# sum 方法返回乙個含有列小計的 series

in [

146]

: df.

sum(

)out[

146]

: one 3.0

two 5.0

dtype: float64

# axis 將會按行進行求和運算,na 值會自動被排除

in [

147]

: df.

sum(axis=1)

out[

147]

: a 1.0

b 5.0

c 0.0

d 2.0

dtype: float64

# 通過 skipna 引數可以禁用 na 值參與計算

# idxmax、idxmin 返回的是間接統計(比如達到最小值或最大值的索引)

in [

153]

: df.idxmax(

)out[

153]

: one b

two b

dtype:

object

# cumsum 則是累計型的

in [

154]

: df.cumsum(

)out[

154]

: one two

a 1.0 nan

b 3.0

3.0c nan nan

d 3.0

5.0

describe 用於一次性產生多個匯**計:

相關係數與協方差p156

唯一值、值計數以及成員資格

從一維 series 中提取不重複的值時,可以使用 unique 函式:

in [

156]

: obj = series(

['c'

,'a'

,'d'

,'a'

,'a'

,'b'

,'b'

,'c'

,'c'])

in [

157]

: obj.unique(

)out[

157]

: array(

['c'

,'a'

,'d'

,'b'

], dtype=

object

)

value_counts 用於計算乙個 series 中各值出現的頻率:

in [

160]

: obj.value_counts(

)out[

160]

: c 3

a 3

b 2

d 1

dtype: int64

# 頂級 pandas 方法,可用於任何陣列或序列

in [

162]

: pd.value_counts(obj.values, sort=

false

)out[

162]

: a 3

c 3

b 2

d 1

dtype: int64

isin 用於判斷向量化集合的成員資格,可用於選取 series 中或 dataframe 列中資料的子集:

pandas彙總和計算描述統計

pandas 物件擁有一組常用的數學和統計方法。他們大部分都屬於簡約和匯 計,用於從series中提取單個值 如sum或mean 或從dataframe的行或列中提取乙個series。跟對應的numpy陣列方法對比,他們都是基於沒有缺失資料的假設而構建的。看例子 呼叫dataframe的sum方法將...

pandas入門 彙總和計算描述統計

from pandas import dataframe,series import numpy as np df dataframe 1.4,np.nan 7.1,4.5 np.nan,np.nan 0.75,1.3 index a b c d columns one two print df o...

Junit 4功能彙總和簡述

此處不細說,直接參考簡單明瞭的wiki吧,裡面的內容就是junit4 jar包的使用和執行簡單測試例項,10分鐘即可完成入門 junit4幾乎所有功能官方彙總列表,可從此了解junit4的各種功能,官方wiki相當簡潔明瞭 此處對較重要的功能稍微彙總,若有感興趣的功能可到官方wiki進一步了解 注意...