常用統計方法總結和R語言實現

2021-10-09 06:44:44 字數 938 閱讀 8638

控制混雜

#分組統計標準差

sd=aggregate(df$var,by=list(df$group)

,fun=sd)

#分組統計均值

mean=aggregate(df$var,by=list(df$group)

,fun=mean)

anova=aov(df$var1~df$var2)

summary(anova)

lowtir=c(6,

4,5,

5)hightir=c(26,

17,53,

29)data_drug=data.frame(lowtir,hightir,row.names = c(

"胰島素"

,"磺脲類"

,"二甲雙胍"

,"阿卡波糖"

#方法一

ks.test(x,

"pnorm"

)#方法二

library(nortest)

lillie.test(x)

shapiro.test(x)

#r語言中的shapiro test 限制樣本量<5000

library(matchit)

R語言常用統計功能

方差分析 線性回歸lm 主成分分析 t.test x,y null,alternative c two.sided less greater mu 0,paired false,var.equal false,conf.level 0.95 其中x,y是由資料構成的向量,如果只提供x,則作單個正態總...

R語言實現KNN 演算法

knn是機器學習中最簡單的分類演算法之一 就是把每乙個測試樣本跟訓練樣本中的每乙個樣本求他們的歐式距離,然後選出最小的幾個,裡面哪乙個類多 這個測試樣本就屬於哪乙個類 用r語言自帶的iris 寫了一下 data iris length iris 1 idx sample 150,100 train ...

R語言實現RMF模型

rmf模型說明 rmf模型是客戶管理中,常被用來衡量客戶價值和客戶創利能力的重要方法。它主要考量三個指標 最近一次消費 recency 近期購買的客戶傾向於再度購買 消費頻率 frequency 經常購買的客戶再次購買概率高 消費金額 monetary 消費金額較多的客戶再次消費可能性更大 根據上述...