《模式識別》自學筆記（二）基於統計的模式識別

解決模式識別問題的方法主要歸納為基於知識的方法和基於資料的方法兩大類。

基於知識的方法，主要是以專家系統為代表的方法。其基本思想是根據人們已知的關於研究物件的知識，整理出若干描述特徵與類別間關係的準則，建立一定的計算機推理系統，對未知樣本通過這些知識推理決策類別。以專家系統為例，專家系統的組成部分包括使用者介面、推理機和知識庫，使用者介面用於獲取使用者的輸入並將結果返回給使用者；推理機是專家系統的大腦，包含解決特定問題的規則，當試圖回答使用者的查詢時，它選擇要應用的事實和規則。它為知識庫中的資訊提供了推理；知識庫是事實的儲存庫，它儲存有關問題域的所有知識，它是從某一特定領域的不同專家那裡獲得的。

基於資料的方法，在確定了描述樣本所採用的知識之後，這些方法並不是依靠人們對所研究物件的認識來建立分類系統，而是蒐集一定數量的已知樣本，用這些樣本作為訓練集來訓練一定的模式識別機器，使之在訓練後能夠對未知樣本進行分類。

基於資料的方法是模式識別的主要方法，在無特別說明的情況下，人們說模式識別通常就是指這一類方法。

基於資料的模式識別的基礎是統計模式識別，即依據統計的原理來建立分類器，通常人們說模式識別方法主要是指統計模式識別方法。該方法適用於我們已經知道物件的某些特徵與類別是有關係，但無法確切描述這種關係的情況，如果類別和特徵之間的關係可以被描述出來，那麼採用基於知識的方法可能會更好。而如果二者之間的關係完全隨機，不存在規律，那麼應用模式識別也無法得到有意義的結果。

在模式識別問題中，如果我們的訓練樣本數類別已知，那麼使用該樣本訓練分類器的方法屬於監督學習，稱為監督模式識別。即我們訓練過程中是有「導師的」。

在一些兒童智力遊戲中，如將數字1,2,7,8劃分為最合理的幾組，我們可以根據數字的奇偶性分為（1,7）和（2,8）兩組，也可以根據數字的大小分為（1,2）和（7,8）兩組，對於類似的模式識別問題，我們事先並不知道要劃分的是什麼類別，更沒有類別已知的樣本用作訓練，甚至我們不知道有多少類別，我們所要做的就是根據樣本特徵將樣本聚為幾類，使屬於同一類的樣本在一定意義上是相似的，而不同類之間的樣本則有較大差異。這就是非監督模式識別，在統計中通常稱為聚類。

對於非監督模式識別，採用不同的方法和不同的假定可能會導致不同的結果，要評價哪種結果更可取或更符合實際情況，除了一些衡量聚類性質的一般準則外，往往還需要對照該項研究的意圖和在聚類結果的基礎上後續的研究來確定。聚類結果只是數學上的一種劃分，對應用的實際問題是否有意義，有什麼意義需要結合更多的專業知識進行解釋。

《模式識別》自學筆記（二）基於統計的模式識別

基於神經網路的模式識別

《模式識別與智慧型計算》基於二值資料的貝葉斯分類實現

模式識別和機器學習筆記第二章概率分布

《模式識別》自學筆記 （二）基於統計的模式識別

基於神經網路的模式識別

《模式識別與智慧型計算》基於二值資料的貝葉斯分類實現

模式識別和機器學習 筆記 第二章 概率分布

相關推薦

《模式識別》自學筆記（二）基於統計的模式識別

模式識別和機器學習筆記第二章概率分布