資料分析之基本統計

2021-10-01 20:05:41 字數 698 閱讀 8514

data.score.describe()

data.score.size

data.score.max()

data.score.min()

data.score.sum()

data.score.mean() #平均值

data.score.var() #方差

data.score.std() #標準差

#累計求和:

data.score.cumsum() #注意:不是單純的求和!它的返回值是乙個序列,可以看到累計求和的過程資料

data.score.argmin() #最小值的位置(下標從0開始)

data.score.argmax() #最大值的位置

#下面這個函式很常用,特別是在rfm分析當中。函式名稱:分位數函式;作用:進行分位數的求解

#什麼是統計學中的p分位數:

#就是先把一列數按從小到大排序,如果一共有n個數,那麼四分之一分位數就是第n*0.25個數,四分之三分位數就是第n*0.75個數,以此類推,p分位數就是第n*p個數.如果n*p不是整數則往最接近的較大的整數上歸

#求出排序在30%的數值:

data.score.quantile(0.3,interpolation="nearest")

#interpolation="nearest" 表示如果找不到精確的百分位排序數,那麼使用離它最近的那個數字進行返回

python筆記24 資料分析之基本統計

coding utf 8 1 概念 基本統計分析 描述性統計分析,用來概括事物整體狀況以及事物間聯絡 即事物的基本特徵 以發現其內在規律的統計分析方法。常用的統計指標 計數 求和 平均值 方差 標準差 方差 統計中的方差 樣本方差 是每個樣本值與全體樣本值的平均數之差的平方值的平均數。在許多實際問題...

資料分析統計

select count 0 sum oi.aunt 10 to char oi.cre date,yyyy mm dd hh24 d count to char oi.crea date,yyyy mm dd hh24 c from eall.orer ite oi where oi.cratda...

Spark 大資料分析 MLlib,基本統計

statistics的colstats函式是列統計方法,該方法可以計算每列最大值 最小值 平均值 方差值 l1範數 l2範數。val datapath e scala testdata sample stat.txt val rdd sc.textfile datapath map split ma...