機器學習十講01

2021.1.26

***************=

概論人工智慧》機器學習》深度學習

機器學習問題

資料->聚類、分類、**、異常值分析

機器學習的基本方法

監督學習

1、資料集中的樣本帶有標籤，有明確目標。

2、回歸和分類。

無監督學習

1、資料集中的樣本沒有標籤，沒有明確目標。

2、聚類、降維、排序、密度估計、關聯規則挖掘

*強化學習（介於前兩者之間）

1、智慧型決策的過程，通過過程模擬和觀察來不斷學習，提高決策能力

2、alphgo

基本概念

資料集：乙個樣本集合

樣本：資料集的一行。乙個樣本包含乙個或多個特徵，此外還可能包含乙個標籤。

特徵：進行**時使用的輸入變數。

訓練集：用於訓練模型的資料集。

測試集：用於測試

模型：x，y之間的對映關係。

損失函式：

優化目標：

監督學習

回歸問題

樣本資料有目標、標籤，類似高中的誤差分析。

分類資料樣本是集散型別

找一根分割線將資料分開，具有最大分割距離是最好的

有的資料線性不可分，可以公升維。

無監督學習

概念：將資料集中相似的資料進行分組

例子：k——means聚類

過度擬合問題

模型過於複雜導致已知資料**的很好，但對未知資料**很差。

正則化模型選擇

交叉驗證

k折交叉驗證

機器學習十講第一講

我們將機器學習定義為一組能夠自動檢測模式資料的方法，然後利用未發現的模式來未來的資料，或者在不確定的情況下執行各種決策例如計畫如何收集更多的資料模型和計算能力深度學習 gpu 分布式系統廣泛的應用場景營銷廣告金融交通醫療等是指資料採集資料清洗資料分析和資料應用的整個流程中的...

機器學習十講第二講回歸

資料酷客大講堂機器學習第二講用乙個或多個自變數來因變數的數學方法在機器學習中，回歸指的是一類變數為連續值的有監督學習方法在回歸模型中，需要的變數叫做因變數，用來解釋因變數變化的變數叫做自變數。一元線性回歸多元線性回歸可能遇到的問題多重共線性最小二乘的引數估計為 widehat...

機器學習十講第三講

本講開始講了梯度下降演算法和最大似然估計演算法。樣本數量 n classes 2,類別數量 n features 2,特徵數量 n informative 2,有資訊特徵數量 n redundant 0,冗餘特徵數量 n repeated 0,重複特徵數量 n clusters per class ...

機器學習十講01

機器學習十講 第一講

機器學習十講 第二講回歸

機器學習十講第三講

相關推薦

機器學習十講第一講

機器學習十講第二講回歸