機器學習中涉及到的演算法有哪些（下）

首先我們給大家介紹一下boosting 和 adaboost，首先，boosting 是一種整合技術，它試圖整合一些弱分類器來建立乙個強分類器。這通過從訓練資料中構建乙個模型，然後建立第二個模型來嘗試糾正第乙個模型的錯誤來完成。一直新增模型直到能夠完美**訓練集，或新增的模型數量已經達到最大數量。而adaboost 是第乙個為二分類開發的真正成功的 boosting 演算法。這是理解 boosting 的最佳起點。現代 boosting 方法建立在 adaboost 之上，最顯著的是隨機梯度提公升。當然，adaboost 與短決策樹一起使用。在第乙個決策樹建立之後，利用每個訓練例項上樹的效能來衡量下乙個決策樹應該對每個訓練例項付出多少注意力。難以**的訓練資料被分配更多權重，而容易**的資料分配的權重較少。依次建立模型，每乙個模型在訓練例項上更新權重，影響序列中下乙個決策樹的學習。在所有決策樹建立之後，對新資料進行**，並且通過每個決策樹在訓練資料上的精確度評估其效能。所以說，由於在糾正演算法錯誤上投入了太多注意力，所以具備已刪除異常值的乾淨資料十分重要。

而學習向量量化也是其中的乙個演算法，可能大家不知道的是，k近鄰演算法的乙個缺點是我們需要遍歷整個訓練資料集。學習向量量化演算法（簡稱 lvq）是一種人工神經網路演算法，它允許你選擇訓練例項的數量，並精確地學習這些例項應該是什麼樣的。而學習向量量化的表示是碼本向量的集合。這些是在開始時隨機選擇的，並逐漸調整以在學習演算法的多次迭代中最好地總結訓練資料集。在學習之後，碼本向量可用於**。最相似的近鄰通過計算每個碼本向量和新資料例項之間的距離找到。然後返回最佳匹配單元的類別值或作為**。如果大家重新調整資料，使其具有相同的範圍，就可以獲得最佳結果。當然，如果大家發現knn在大家資料集上達到很好的結果，請嘗試用lvq減少儲存整個訓練資料集的記憶體要求。

機器學習中涉及到的演算法有哪些（下）

機器學習中涉及到的演算法有哪些（特別篇）

機器學習中涉及到哪些數學工具？

機器學習涉及到應用（一）

機器學習中涉及到的演算法有哪些（下）

機器學習中涉及到的演算法有哪些（特別篇）

機器學習中涉及到哪些數學工具？

機器學習涉及到應用（一）

相關推薦