Pandas庫(2) 資料的統計分析

2021-10-09 05:11:06 字數 962 閱讀 1872

1.0 pandas 中的資料型別:

series

dataframe

一維二維的、**型

每個元素都有各自的標籤(數字/字元)

可儲存多個不同型別資料,每個軸都有標籤

可視為乙個由帶標籤的元素組成的 numpy 陣列

可視為乙個 series 的字典

2.0 適用於series和dataframe資料型別

函式名描述引數說明

使用說明

.sum()

求和.mean()

求期望dataframe.count(axis=0, level=none, numeric_only=false)

求非nan值的個數

axis: , 預設為 0

如果為每列生成0或'index'計數。

如果為每行生成1或'columns'計數

level: int 或 str, 可選

如果軸是multiindex(分層),

則沿特定級別計數,摺疊到dataframe中。

乙個str指定級別名稱。

numeric_only: boolean, 預設為 false

僅包含float,int或boolean資料。

.std()

求標準差

.var()

求方差.max()

最大值.min()

最小值.median()

中位數3.0 只適用於series型別

方法名描述.argmin() .argmax()

計算資料的最小/大值所在位置的索引位置(自動索引)

.idxmin() .idxmax()

計算資料的最小/大值所在位置的索引位置(自定義索引)

pandas統計分析基礎(2)

pandas描述性統計方法的常見方法 方法統計含義 方法統計含義 min最小值 max最大值 mean 均值count 非空數目 median 中位數mode 眾數std 標準差var 方差cov 協方差ptp 極差skew 樣本偏度 kurt 樣本峰度 sem標準誤差 quantile 四分位數 ...

pandas的統計分析

import pandas as pd import numpy as np data pd.read excel meal order detail.xlsx print data n data print data 的列索引 n data.columns print data 的資料型別 n d...

Pandas庫 資料的基本統計分析

類似numpy庫,可見此博文 numpy的統計函式 1.0 適用於series和dataframe資料型別 函式名描述sum 求和mean 求期望count 求非nan值的個數 std 求標準差 var 求方差max 最大值min 最小值median 中位數2.0 只適用於series型別 方法名描...