人工智慧入門 R語言資料分析與資料挖49

2021-09-16 12:48:16 字數 325 閱讀 7272

解讀summary

ß殘差統計量:

ß殘差第一四分位數(1q)和第三分位數(q3)有大約相同的幅度,意味著有較對稱的鐘形分布。

ß係數:

ß標記為estimate的列包含由普通最小二乘法計算出來的估計回歸係數。

ß標記為std.error的列是估計的回歸係數的標準誤差。

ß如果乙個變數的係數是0,那麼該變數是無意義的,它對模型毫無貢獻。因此需要了解,真正的係數為0的可能性有多大?這是t統計量和p值的目的,在彙總中被標記為t value和 pr(>|t|)。

ßp值估計係數不顯著的可能性,有較大p值的變數是可以從模型中移除的候選變數。

人工智慧入門 R語言資料分析與數62

不純度的度量 gini係數 是一種與資訊熵類似的做特徵選擇的方式,可以用來衡量資料的不純度。gini係數的計算方式如下 資訊增益 info gain 用於id3 gini用於cart 資訊增益率 info gain ratio 用於c4.5。id3演算法思想描述 a 對當前例子集合,計算屬性的資訊增...

人工智慧入門 R語言資料分析與數72

rpart引數設定 rpart.control對樹進行一些設定 xval是10折交叉驗證 minsplit是最小分支節點數,這裡指大於等於20,那麼該節點會繼續分劃下去,否則停止 minbucket 葉子節點最小樣本數 maxdepth 樹的深度 cp全稱為complexity parameter,...

人工智慧入門 R語言資料分析86

啟用函式 人工神經網路 人工神經網路 大量神經元節點按一定體系結構連線成網狀結構。神經網路一般都具有輸入層,隱含層和輸出層。前饋神經網路 前饋神經網路,是人工神經網路的一種。在此種神經網路中,各神經元從輸入層開始,接收前一級輸入,並輸出到下一級,直至輸出層。整個網路中無反饋,可用乙個有向無環圖表示。...