機器學習之基礎理論相關了解

2021-08-10 18:45:26 字數 2079 閱讀 2179

一 基礎概念(學習起點)

二 有監督學習

有監督學習的應用面仍然是最廣泛的,這是因為我們現實中遇到的很多問題都是希望對某個事物的某個屬性做出**,而這些問題通過合理的抽象和變換,都可以轉化為有監督學習的問題。

學習步驟如下:

1、

在學習複雜模型之前,

先學習幾個最簡單的模型,典型的如樸素貝葉斯

。樸素貝葉斯有很強的假設,這個假設很多問題都不滿足,模型結構也很簡單,所以其優化效果並不是最好的。但也正是由於其簡單的形式,非常利於學習者深入理解整個模型在建模和優化過程中的每一步,這對於搞清楚機器學習是怎麼一回事情是非常有用的。

樸素貝葉斯的模型形式通過一番巧妙的變換之後,可以得到和邏輯回歸形式上非常統一的結果

2、

在掌握了機器學習模型的基礎流程之後,需要學習兩種最基礎的模型形式:

線性模型和樹形模型

,分別對應著

線性回歸/邏輯回歸和決策回歸/分類樹。

現在常用的模型,無論是淺層模型還是深度學習的深層模型,都是基於這兩種基礎模型形式變幻而來。而學習這兩種模型的時候需要仔細思考的問題是:這兩種模型的本質差異是什麼?為什麼需要有這兩種模型?他們在訓練和**的精度、效率、複雜度等方面有什麼差異?了解清楚這些本質的差異之後,才可以做到根據問題和資料的具體情況對模型自如運用。

3、掌握了線性模型和樹形模型這兩種基礎形式之後,下一步需要掌握的是這兩種基礎模型的複雜形式。其中線性模型的複雜形式就是多層線性模型,也就是神經網路。樹模型的複雜形式包括以 gdbt 為代表的 boosting 組合,以及以隨機森林為代表的 bagging 組合。

三 無監督學習

無監督學習的一大類內容是在做聚類,做聚類的意義通常可以分為兩類:一類是將聚類結果本身當做最終的目標,另一類是將聚類的結果再作為特徵用到有監督學習中。但這兩種意義並不是和某種聚類方法具體繫結,而只是聚類之後結果的不同使用方式,這需要在工作中不斷學習、積累和思考。而在入門學習階段需要掌握的,是不同聚類演算法的核心差異在**。

例如最常用的聚類方法中,

kmeans 和 dbscan分別適合處理什麼樣的問題?高斯混合模型有著什麼樣的假設?lda 中文件、主題和詞之間是什麼關係?這些模型最好能夠放到一起來學習,從而掌握它們之間的聯絡和差異,而不是把他們當做乙個個孤立的東西來看待。

除 了 聚 類 以 外 ,近 年 來 興 起 的嵌 入 表 示( embedding representation )也是無監督學習的一種重要方法。這種方法和聚類的差異在於,聚類的方法是使用已有特徵對資料進行劃分,而嵌入表示則是創造新的特徵,這種新的特徵是對樣 本的一種全新的表示方式。這種新的表示方法提供了對資料全新的觀察視角,這種視角提供了資料處理的全新的可能性。此外,這種做法雖然是從 nlp 領域中興起,但卻具有很強的普適性,可用來處理多種多樣的資料,都可以得到不錯的結果,所以現在已經成為一種必備的技能

四 機器學習演算法工程師領域現狀

現在可以說是機器學習演算法工程師最好的時代,各行各業對這類人才的需求都非常旺盛。典型的包括以下一些細分行業:

但是所謂「工資越高,責任越大」,企業對於演算法工程師的要求也在逐漸提高。整體來說,一名高階別的演算法工程師應該能夠處理「資料獲取→資料分析→模型訓練調優→模型上線」這一完整流程,並對流程中的各種環節做不斷優化。一名工程師入門時可能會從上面流程中的某乙個環節做起,不斷擴大自己的能力範圍。 除了上面列出的領域以外,還有很多傳統行業也在不斷挖掘機器學習解決傳統問題的能力,行業的未來可謂潛力巨大。

深度學習基礎理論

1.卷積後特徵圖大小計算 方形的特徵輸入 i 方形的卷積核尺寸 k 每個維度相同的步長 s 每個維度相同的padding p 輸出特徵圖尺寸 o i 2p k s 1 2.反卷積 對於乙個 步長為s 的卷積而言,它的反卷積可以看作是在輸入特徵單元之間插入 s 1個0,將得到的特徵圖作為輸入特徵圖,然...

軟體測試之基礎理論

思維導圖 一.軟體開發模型 1.瀑布模型 線性模型的一種 需求分析 設計 psd,美工 編碼 實現 軟體測試 完成 維護 優點 缺點 改良 每個階段融入小的設計迭代階段 2.快速原型模型 快速分析 需求說明 構造原型 原型 執行原型 實現乙個基本原型,讓使用者對原型進行評價,逐步調整,使其滿足使用者...

python基礎之爬蟲基礎理論

在初步了解到正規表示式之後,今天我們學習一下關於爬蟲的理論及最基本的爬去!使用爬蟲的 語句,通常要用到如下幾個模組 from urllib import request from urllib.request import urlopen from urllib.parse import urlen...