pandas入門 彙總和計算描述統計

2022-06-14 15:57:09 字數 1894 閱讀 3476

from pandas import dataframe, series

import numpy as np

df = dataframe([[1.4,np.nan],[7.1,-4.5],

[np.nan,np.nan],[0.75,-1.3]],

index=['a','b','c','d'],

columns=['one','two'])

print(df)

''' one two

a 1.40 nan

b 7.10 -4.5

c nan nan

d 0.75 -1.3

'''# 呼叫dataframe的sum方法會返回乙個含有列小計的series

print(df.sum())

'''one 9.25

two -5.80

dtype: float64

'''# 傳入axis=1將會進行求和運算

print(df.sum(axis=1))

'''a 1.40

b 2.60

c 0.00

d -0.55

dtype: float64

'''# na值會自動被排除,除非整個切換(行或列)都是na,skipna選項可禁用該功能

print(df.mean(axis=1,skipna=true)) # 預設skipna=true

'''a 1.400

b 1.300

c nan

d -0.275

dtype: float64

'''print(df.mean(axis=1,skipna=false))

'''a nan

b 1.300

c nan

d -0.275

dtype: float64

'''print(df.idxmax()) # 最大值索引

'''one b

two d

dtype: object

'''print(df.idxmin()) # 最小值索引

'''one d

two b

dtype: object

'''print(df.cumsum()) # 累計

''' one two

a 1.40 nan

b 8.50 -4.5

c nan nan

d 9.25 -5.8

'''print(df.describe()) # 一次性產生多個匯**計

''' one two

count 3.000000 2.000000

mean 3.083333 -2.900000

std 3.493685 2.262742

min 0.750000 -4.500000

25% 1.075000 -3.700000

50% 1.400000 -2.900000

75% 4.250000 -2.100000

max 7.100000 -1.300000

'''# 對於非數值型資料,describe會產生另外一種統計

obj = series(['a','a','b','c']*4)

print(obj.describe())

'''count 16

unique 3

top a

freq 8

dtype: object

'''

描述和匯**計

pandas彙總和計算描述統計

pandas 物件擁有一組常用的數學和統計方法。他們大部分都屬於簡約和匯 計,用於從series中提取單個值 如sum或mean 或從dataframe的行或列中提取乙個series。跟對應的numpy陣列方法對比,他們都是基於沒有缺失資料的假設而構建的。看例子 呼叫dataframe的sum方法將...

Pandas 基礎 (4) 彙總和計算描述統計

pandas 物件擁有一組常用的數學和統計方法,他們大部分都屬於約簡和匯 計,用於從 series 中提取單個值 如 sum mean 或者從 dataframe 的行或列中提取乙個 series。in 144 df dataframe 1,np.nan 2,3 np.nan,np.nan 0,2 ...

pandas 學習彙總17 計算 tcy

1.算數計算 2018 11 8 2018 12 101.1函式 series.product axis,skipna,level,返回請求軸的值的乘積 各個元素相乘 series.dot other 矩陣乘法與dataframe或內部產品與series物件。1.2算數計算例項 s1,s2同為序列或...