關於機器學習的文章

2021-06-29 11:37:48 字數 1264 閱讀 6334

看一篇關於

機器學習的文章,擷取了其中一些有啟發的話 :

1. 「統計」思想將在你學習「機器學習」相關理念時無時無刻不伴隨,相關而不是因果的概念將是支撐機器學習能夠工作的核心概念。

2. 線性回歸就是我們前面說過的房價求解問題。如何擬合出一條直線最佳匹配我所有的資料?一般使用「最小二乘法」來求解。最小二乘法將最優問題轉化為求函式極值問題。計算機科學界專門有乙個學科叫「數值計算」,專門用來提公升計算機進行各類計算時的準確性和效率問題。例如,著名的「梯度下降」以及「牛頓法」也非常適合來處理求解函式極值的問題。

3. 邏輯回歸屬於分類演算法,也就是說,邏輯回歸**結果是離散的分類。邏輯回歸只是對對線性回歸的計算結果加上了乙個sigmoid函式,將數值結果轉化為了0到1之間的概率。

4. 神經網路:

輸入層,隱藏層,和輸出層。輸入層負責接收訊號,隱藏層負責對資料的分解與處理,最後的結果被整合到輸出層。每層中的乙個圓代表乙個處理單元,可以認為是模擬了乙個神經元,若干個處理單元組成了乙個層,若干個層再組成了乙個網路,也就是」神經網路」。

5. 通過跟高斯「核」的結合,支援向量機可以表達出非常複雜的分類界線,從而達成很好的的分類效果。「核」事實上就是一種特殊的函式,最典型的特徵就是可以將低維的空間對映到高維的空間。

6. 無監督演算法:聚類演算法中最典型的代表就是k-means演算法;降維演算法,主要代表是pca演算法(即主成分分析演算法);

7. 推薦演算法:一類是基於物品內容的推薦,另一類是基於使用者相似度的推薦。最有名的演算法就是協同過濾演算法。

8. 機器學習界還有其他的如高斯判別,樸素貝葉斯,決策樹等。 

9. 大資料也包含以下四種分析方法:

1.大資料,小分析:即資料倉儲領域的olap分析思路,也就是多維分析思想。

2.大資料,大分析:這個代表的就是資料探勘與機器學習分析法。

3.流式分析:這個主要指的是事件驅動架構。

4.查詢分析:經典代表是nosql資料庫。

10. 由於神經網路在隱藏層擴大到兩個以上,其訓練速度就會非常慢,因此實用性一直低於支援向量機。2023年,geoffrey hinton在科學雜誌《science》上發表了一篇文章,論證了兩個觀點:

1.多隱層的神經網路具有優異的特徵學習能力,學習得到的特徵對資料有更本質的刻畫,從而有利於視覺化或分類;

2.深度神經網路在訓練上的難度,可以通過「逐層初始化」 來有效克服。

11. 計算機的潛意識

機器學習系列文章序言

機器學習專欄是我在2018年暑假開始全面入門機器學習的心得和總結,在這個為期接近三個月的暑假中,我會學習傳統機器學習,深度學習,以及強化學習三類主要的機器學習方法。在本欄目中,我不會照葫蘆畫瓢的搬抄其他地方的資料,所有的文章均為原創,均為我的心得體會和總結。所以存在一定程度的簡潔和省略。本專欄的目的...

關於機器學習的問題

svm只考慮分類面附近的點,即支援向量,所以對離群點不敏感 lr考慮所有樣本點,所以對離群點敏感。梯度提公升決策樹gbdt是一種基於整合思想的決策樹模型,即每顆樹學的是之前所有樹結論之和的殘差,這個殘差就是乙個加 值後能得真實值的累加量,將每次 出的結果與目標值的殘差作為下一次學習的目標。1 直方圖...

關於社會機器學習

機器學習的目的是模擬人類的學習過程。機器學習雖然取得很大的成功,但是到目前為止,它忽視了乙個重要的因素,也就是人的社會屬性。我們每個人都是社會的一分子,很難從出生就脫離社會獨自生存 學習並不斷進步。既然人類的智慧型離不開社會,那麼我們能否讓機器們也具有某種意義的社會屬性,模擬人類社會中的關鍵元素進行...