機器學習一 機器學習概要

2021-08-20 16:26:16 字數 1411 閱讀 1142

回歸

是指把實函式在樣本點附近加以近似的有監督的模式識別問題。對乙個或多個自變數和因變數之間關係進行建模,求解的一種統計方法。

分類

是指對於指定的模式進行識別的有監督的模式識別問題。

異常檢測

是指尋找輸入樣本ni=1i

=1

n中所包含的異常資料的問題。

常採用密度估計的方法:正常資料為靠近密度中心的資料;異常資料為偏離密度中心的資料。

聚類

與分類問題類似,是無監督的模式識別問題(在聚類問題中常用簇代表類別)。性質→簇,關進課題是計算樣本之間的相似度。

降維

是指從高維度資料中提取關鍵資訊,將其轉換為易於計算的低維度問題進而求解的方法。

乙個經典的分類問題,對模式x⃗ 

x

→的類別

y y

進行**,記為y^

' role="presentation" style="position: relative;">y^y

^.y^

=arg

maxy

p(y|

x⃗ ) y^=

argm

axyp

(y|x

→)

在已知模式x⃗ 

x

→時,求得使分類類別

y y

的條件概率(模式識別中稱為後驗概率)p(

y|x→

)' role="presentation" style="position: relative;">p(y

|x⃗ )

p(y|

x→)達到最大值的類別y^

y

^. ar

gmax

yp(y

|x⃗ )

a rg

maxy

p(y|

x→

)是指當條件概率p(

y|x⃗ 

) p(y

|x→)

取最大值時對應的

y y

值。判別式分類

應用訓練集直接對後驗概率p(

y|x→

)' role="presentation" style="position: relative;">p(y

|x⃗ )

p(y|

x→)進行學習的過程。

著有《統計學理論的本質》一書的弗拉基公尺爾·萬普尼克(vladimir vapnik)提到:「要試圖得到所需要的答案,而不是更一般的答案。很可能你擁有足夠的資訊來很好地解決乙個感興趣的特定問題,但卻沒有足夠的資訊來解決乙個一般性的問題。」

機器學習概要

機器學習是人工只能的乙個分支。讓你使用計算機設計乙個系統使他continous clustering dimensionality reduction o svd o pca o k means categories association analysis o apriori o fp growt...

機器學習概要

機器學習主要分兩種,一種是監督學習,一種是無監督學習。監督學習 supervised learning 是一種已知樣本類別的學習方式。監督學習有兩種情況。一種是回歸。對於連續量來說,通過樣本確定其回歸的模型,求得代價最小的回歸方程,來 新的資料,這種方式稱為回歸。如 房屋成交 的 另一種是分類。對於...

機器學習(概要版)

機器學習 若任務a的效能可以用b度量,那麼a的效能會隨著經驗c的增加而提高,舉例1 根據身高 體重,通過資料,能過畫出簡單斜線 另外增加別的變數,例如性別等,新增不同 線,減少預期和實際之間的差距。舉例2,颶風 系統,假設手裡擁有以前發生過的資料和支援颶風產生的前三個月的天氣資訊,通過資料清洗,找到...