R語言異常值診斷,計算box cox值

2021-10-24 19:57:16 字數 1020 閱讀 4755

data<-data.frame() #資料框的構建

異常值診斷

```r

y=c(160,260,210,265,240,220,275,160,275,250)

x1=c(70,75,65,74,72,68,78,66,70,65)

x2=c(35,40,40,42,38,45,42,36,44,42)

x3=c(1,2.4,2,3,1.2,1.5,4,2,3.2,3)

shuju<-data.frame(y,x1,x2,x3)

shuju

lm1=lm(y~.,data=shuju)#(2)求三元線性回歸方程(3)擬合優度檢驗

summary(lm1)

#異常值與強影響點

#殘差

shuju.stdres<-rstudent(lm1);

#中心化槓桿值

ch<-hatvalues(lm1)-1/10;

#cook距離

shuju.cooks<-cooks.distance(lm1);

#找異常值

isoutlier<-abs(shuju.stdres)>3;

isoutlier #殘差選擇正負3倍標準差以外的

isch<-ch>2*1/10;

isch #槓桿值大於兩倍的hba

iscooks<-shuju.cooks>1;

iscooks #庫克距離大於1的

r語言進行box-cox轉換:

library(mass)

b <- boxcox(y ~ x1 + x2 + x3 + x4, data=data)

blambda <- b$x

lik <- b$y

bc <- cbind(lambda, lik)

bc[order(

-lik),]

#結果λ=-0.3時lik值最大,因此λ取值-0.3

R語言 觀測異常值並改進

全面的回歸分析包括對異常值的分析 離群點 高槓桿值點 強影響點。離群點 模型效果不佳的觀測點。使用car包中的outliertest 函式,可以求得最大標準化殘差絕對值bonferroni調整後的p值,若不顯著,則說明資料集中沒有離群點,若顯著,則必須刪除該離群點。可見,在這個回歸模型中 nevad...

R中異常值檢測

data1 complete.cases selectdata 布林判斷 true代表1,false代表0 sum complete.cases selectdata 完整資料200條 sum complete.cases selectdata 不完整資料1條 mean complete.cases...

R語言回歸分析中的異常值點的介紹

1 離群點 如何識別離群點?1 q q圖,落在置信區間帶外的點即可被認為是離群點。2 乙個粗糙的判斷準則 標準化殘差值大於2或者小於2的點可能是離群 3 library car outliertest fit 顯示離群點 rstudent unadjusted p value bonferonni ...