快速理清機器學習

2021-08-27 21:25:45 字數 1254 閱讀 5736

機器學習方法就是計算機利用已有資料,得出了某種模型,並利用此模型**未來的一種方法。

機器學習模型

因變數 我們希望**的結果

自變數 用來**的輸入

模式識別=機器學習資料探勘=機器學習+資料庫資料探勘演算法就是機器學習的演算法在資料庫中的優化

統計學習=機器學習區分:統計學習重點在於統計模型的發展與優化,機器學習更在乎解決問題

計算機視覺=影象處理+機器學習影象處理技術用於把影象作為機器學習模型中的輸入,機器學習負責從影象中識別出相應模式。

識圖/手寫字元識別/車牌識別

語音識別=語音處理+機器學習

自然語言處理=文字處理+機器學習自然語言處理即為讓機器理解人類的語言,自然語言處理中大量使用編譯原理相關的詞法分析、語法分析,在理解層面使用到了語義理解與機器學習

1 回歸演算法線性回歸:擬合一條直線最佳匹配所有資料(最小二乘法)

(數值計算學科:專門提公升計算機在各類計算時的準確性和效率問題 梯度下降/牛頓法)

2 神經網路乙個簡單的神經網路分為輸入層、隱藏層和中間層,輸入層接收訊號,隱藏層對資料分解和處理,最後的結果由輸出層輸出。由若干個處理單元組成一層,若干層組成乙個網路。每個處理單元都是乙個邏輯回歸模型,接收上層輸入,模型**結果作為輸出傳輸到下一層,越深的層次處理的細節越小,通過這樣的過程完成複雜的線性分類。

3 svm支援向量機誕生於統計學習的經典演算法,算是邏輯回歸演算法的強化,用更嚴格的優化條件,獲得更好的分類界線。與函式結合可以表達出非常複雜的分類界限

高斯核 :低維空間對映到高維空間,也就是說,二維平面劃分出的非線性分類界線可以等價於三維平面的線性分類界限。

4 聚類演算法無監督演算法:訓練資料不含標籤,通過訓練推測出資料的標籤。典型代表聚類演算法

聚類演算法:計算種群間的距離,根據距離遠近將資料劃分為多個族群(典型代表k-means)

5降維演算法無監督學習演算法,將資料從高維降低到低維,這裡維度表示資料特徵量的大小(典型代表pca)

6推薦演算法物品內容推薦/使用者相似度推薦

協同過濾演算法

具有多個隱藏層的神經網路稱為深度神經網路,基於深度神經網路的研究稱為深度學習

Python機器學習快速入門

以下 作為個人筆記 python機器學習快速入門 talk is cheap,show me the code import pandas as pd 1 fss dat iris.csv df pd.read csv fss,index col false print df.tail print ...

機器學習之github快速上手

2019 03 19 22 29 06 今天,在下終於也要開啟了自己的部落格學習之旅了。這是寫的第一篇文章,也是乙個好的開始!可能需求的不同吧,我這裡就僅僅練習了如何將github倉庫與個人pc端連線起來。1 轉殖遠端倉庫到本地 2 新增實驗檔案到索引庫 3 提交倉庫的改動 4 推送改動到遠端倉庫中...

機器學習 一文理清資訊熵,相對熵,交叉熵

夏農提出資訊熵主要是用來解決對資訊的量化度量問題,比如說存在選項 a,b,c,d 若每個字母都用8位ascii碼儲存,則表示這個四個選項需要32位bit。如果此時採用二進位制的話,4個選項用2位bit便可表示 00,01,10,11 於是對4個選項資訊進行量化為log 2 4 2 2 4 2 log...