R語言筆記之資料科學演算法總結

2021-08-14 15:52:25 字數 1611 閱讀 7880

1.回歸演算法(regression)

a.一般最小二乘回歸(ordinary least squares)

b.邏輯回歸(logistic regression)

c.自適應樣條回歸(multivariate adaptive regression splines,mars)

d.區域性估計散點圖平滑回歸(locally estimated scatterplot smoothing,loess)

2.基於相似性的模型(instance-based algorithms)

a.k近鄰模型(k-nearest neighbour[knn])

b.學習向量量化(learning vector quantization[lvq])

c.自組織對映(self-organizing map[som])

3.特徵選擇演算法(feature selection algorithms)

a.嶺回歸(k-nearest neighbour,knn)

b.lasso回歸(least absolute sprinkage and selection operator)

c.彈性網路(elastic net)

5.樹模型

a.分類和回歸樹(classification and regression tree,cart)

b.id3(iterative dichotomiser 3)

c.c4.5

d.隨機森林(random forest)

e.隨機助推(gradient boosting machines,gbm)

6.貝葉斯模型(bayesian)

a.樸素貝葉斯

b.平均單依賴估計(aode)

c.貝葉斯網路(bbn)

7.核函式演算法

a.支援向量機

b.徑向基函式

c.線性判別分析

8.聚類演算法

a.k-means

b.分層聚類

9.關聯法則

a.apriori演算法

b.eclat演算法

10.人工神經網路

a.感知器神經網路

b.反向傳遞

c.hopfield網路

d.自組織對映

e.學習向量化

11.深度學習

a.受限波爾茲曼機(rbn)

b.深度網路(dbn)

c.卷積網路

d.堆疊式自動編碼器

12.降維演算法

a.主成分分析(pca)

b.偏最小二乘回歸(pls)

c.高維標度化(mds)

d.探索性因子分析(efa)

13.整合演算法

a.裝袋法

b.隨機森林

c.梯度助推

《資料科學 R語言實現》 1 2 建立R函式

r語言是函式的集合 使用者可以在專案中使用各個程式包中的內建函式,或者為專門的目的定義新的函式。在本教程中,我們會展示如何建立乙個r函式。執行下列步驟來建立你的第乙個r函式。1.在r控制台中鍵入下列 建立第乙個函式 2.使用下列命令,執行使用者定義的函式addnum 或者,你也可以不使用return...

《資料科學 R語言實現》 3 7 捨棄資料

在之前的教程中,我們介紹了如何修改和過濾資料集。這些步驟基本上涵蓋了資料預處理和資料準備的主要過程。但是,我們還想找出資料集中的壞資料。那些壞資料或者不想要的資料應該丟棄,避免生成誤導的結果。這裡,我們會介紹一些移除無用資料的實用方法。按照3.3節 轉換資料型別 教程,把匯入資料的每個屬性轉換成合適...

《資料科學 R語言實現》 3 8 合併資料

資料合併讓我們理解不同資料來源是如何相互關聯的。r中的merge操作與資料庫中的join操作類似,它使用兩個資料集中相同的值來連線兩個資料集。按照3.3節 轉換資料型別 教程,把匯入資料的每個屬性轉換成合適的資料型別。同時按照3.2節 重新命名資料變數 中的步驟,命名employees和salari...