關於機器學習的文章

看一篇關於

機器學習的文章，擷取了其中一些有啟發的話：

1. 「統計」思想將在你學習「機器學習」相關理念時無時無刻不伴隨，相關而不是因果的概念將是支撐機器學習能夠工作的核心概念。

2. 線性回歸就是我們前面說過的房價求解問題。如何擬合出一條直線最佳匹配我所有的資料？一般使用「最小二乘法」來求解。最小二乘法將最優問題轉化為求函式極值問題。計算機科學界專門有乙個學科叫「數值計算」，專門用來提公升計算機進行各類計算時的準確性和效率問題。例如，著名的「梯度下降」以及「牛頓法」也非常適合來處理求解函式極值的問題。

3. 邏輯回歸屬於分類演算法，也就是說，邏輯回歸**結果是離散的分類。邏輯回歸只是對對線性回歸的計算結果加上了乙個sigmoid函式，將數值結果轉化為了0到1之間的概率。

4. 神經網路：

輸入層，隱藏層，和輸出層。輸入層負責接收訊號，隱藏層負責對資料的分解與處理，最後的結果被整合到輸出層。每層中的乙個圓代表乙個處理單元，可以認為是模擬了乙個神經元，若干個處理單元組成了乙個層，若干個層再組成了乙個網路，也就是」神經網路」。

5. 通過跟高斯「核」的結合，支援向量機可以表達出非常複雜的分類界線，從而達成很好的的分類效果。「核」事實上就是一種特殊的函式，最典型的特徵就是可以將低維的空間對映到高維的空間。

6. 無監督演算法：聚類演算法中最典型的代表就是k-means演算法；降維演算法，主要代表是pca演算法(即主成分分析演算法)；

7. 推薦演算法：一類是基於物品內容的推薦，另一類是基於使用者相似度的推薦。最有名的演算法就是協同過濾演算法。

8. 機器學習界還有其他的如高斯判別，樸素貝葉斯，決策樹等。

9. 大資料也包含以下四種分析方法：

1.大資料，小分析：即資料倉儲領域的olap分析思路，也就是多維分析思想。

2.大資料，大分析：這個代表的就是資料探勘與機器學習分析法。

3.流式分析：這個主要指的是事件驅動架構。

4.查詢分析：經典代表是nosql資料庫。

10. 由於神經網路在隱藏層擴大到兩個以上，其訓練速度就會非常慢，因此實用性一直低於支援向量機。2023年，geoffrey hinton在科學雜誌《science》上發表了一篇文章，論證了兩個觀點：

1.多隱層的神經網路具有優異的特徵學習能力，學習得到的特徵對資料有更本質的刻畫，從而有利於視覺化或分類；

2.深度神經網路在訓練上的難度，可以通過「逐層初始化」來有效克服。

11. 計算機的潛意識

關於機器學習的文章

機器學習系列文章序言

關於機器學習的問題

關於社會機器學習

關於機器學習的文章

機器學習系列文章序言

關於機器學習的問題

關於社會機器學習

相關推薦