模式識別之聚類 聚類和分類的區別

2021-09-08 22:23:54 字數 2563 閱讀 8947

高斯聚類

向量刻畫物件,矩陣刻畫運動,用矩陣和向量的乘法施加運動

矩陣的本質居然是運動的描述,線性空間的變化躍遷,選定一組基可以做一次線性變換,換一組基,變換又不同,物件變化等價於座標系的變換,也是座標的變換

幾乎所有的圖形學變化都是4x4的

數學分析的本質思想精華是:

乙個物件可以表達為無窮多個合理選擇的物件的線性和

讓我們想想,達成同乙個變換的結果,比如把點(1, 1)變到點(2, 3)去,你可以有兩種做法。第一,座標繫不動,點動,把(1, 1)點挪到(2, 3)去。第二,點不動,變座標系,讓x軸的度量(單位向量)變成原來的1/2,讓y軸的度量(單位向量)變成原先的1/3,這樣點還是那個點,可是點的座標就變成(2, 3)了,方式不同,結果一樣。     

從第乙個方式來看,那就是我在《理解矩陣》1/2中說的,把矩陣看成是運動描述,矩陣與向量相乘就是使向量(點)運動的過程。在這個方式下, ma = b  的意思是:  

「向量a經過矩陣m所描述的變換,變成了向量b。」  

而從第二個方式來看,矩陣m描述了乙個座標系,姑且也稱之為m。那麼:  ma = b  

意思是: 

「有乙個向量,它在座標系m的度量下得到的度量結果向量為a,那麼它在座標系i的度量下,這個向量的度量結果是b。」 

這裡的i是指單位矩陣,就是主對角線是1,其他為零的矩陣。  

而這兩個方式本質上是等價的。  

我希望你務必理解這一點,因為這是本篇的關鍵。  正因為是關鍵,所以我得再解釋一下。  

在m為座標系的意義下,如果把m放在乙個向量a的前面,形成ma的樣式,我們可以認為這是對向量a的乙個環境宣告。它相當於是說: 

「注意了!這裡有乙個向量,它在座標系m中度量,得到的度量結果可以表達為a。可是它在別的座標系裡度量的話,就會得到不同的結果。為了明確,我把m放在前面,讓你明白,這是該向量在座標系m中度量的結果。」  那麼我們再看孤零零的向量b:  

b  多看幾遍,你沒看出來嗎?它其實不是b,它是:   ib  

也就是說:「在單位座標系,也就是我們通常說的直角座標系i中,有乙個向量,度量的結果是b。」  而 ma = ib的意思就是說:  

「在m座標系裡量出來的向量a,跟在i座標系裡量出來的向量b,其實根本就是乙個向量啊!」 這**是什麼乘法計算,根本就是身份識別嘛。 

從這個意義上我們重新理解一下向量。向量這個東西客觀存在,但是要把它表示出來,就要把它放在乙個座標系中去度量它,然後把度量的結果(向量在各個座標軸上的投影值)按一定順序列在一起,就成了我們平時所見的向量表示形式。你選擇的座標系(基)不同,得出來的向量的表示就不同。向量還是那個向量,選擇的座標系不同,其表示方式就不同。因此,按道理來說,每寫出乙個向量的表示,都應該宣告一下這個表示是在哪個座標系中度量出來的。表示的方式,就是 ma,也就是說,有乙個向量,在m矩陣表示的座標系中度量出來的結果為a。我們平時說乙個向量是[2 3 5 7]t,隱含著是說,這個向量在 i 座標系中的度量結果是[2 3 5 7]t,因此,這個形式反而是一種簡化了的特殊情況。 

注意到,m矩陣表示出來的那個座標系,由一組基組成,而那組基也是由向量組成的,同樣存在這組向量是在哪個座標系下度量而成的問題。也就是說,表述乙個矩陣的一般方法,也應該要指明其所處的基準座標系。所謂m,其實是 im,也就是說,m中那組基的度量是在 i 座標系中得出的。從這個視角來看,m×n也不是什麼矩陣乘法了,而是宣告了乙個在m座標系中量出的另乙個座標系n,其中m本身是在i座標系中度量出來的。 

回過頭來說變換的問題。我剛才說,「固定座標系下乙個物件的變換等價於固定物件所處的座標系變換」,那個「固定物件」我們找到了,就是那個向量。但是座標系的變換呢?我怎麼沒看見?  

請看:  ma = ib  

我現在要變m為i,怎麼變?對了,再前面乘以個m-1,也就是m的逆矩陣。換句話說,你不是有乙個座標系m嗎,現在我讓它乘以個m-1,變成i,這樣一來的話,原來m座標系中的a在i中一量,就得到b了。 

我建議你此時此刻拿起紙筆,畫畫圖,求得對這件事情的理解。比如,你畫乙個座標系,x軸上的衡量單位是2,y軸上的衡量單位是3,在這樣乙個座標系裡,座標為(1,1)的那一點,實際上就是笛卡爾座標系裡的點(2, 3)。而讓它原形畢露的辦法,就是把原來那個座標系: 2 0  0 3  

的x方向度量縮小為原來的1/2,而y方向度量縮小為原來的1/3,這樣一來座標系就變成單位座標系i了。保持點不變,那個向量現在就變成了(2, 3)了。 被矩陣:  1/2   0  0   1/3  

左乘。而這個矩陣就是原矩陣的逆矩陣。 

「對座標系施加變換的方法,就是讓表示那個座標系的矩陣與表示那個變化的矩陣相乘。」   再一次的,矩陣的乘法變成了運動的施加。只不過,被施加運動的不再是向量,而是另乙個座標系。 

如果你覺得你還搞得清楚,請再想一下剛才已經提到的結論,矩陣mxn,一方面表明座標系n在運動m下的變換結果,另一方面,把m當成n的字首,當成n的環境描述,那麼就是說,在m座標系度量下,有另乙個座標系n。這個座標系n如果放在i座標系中度量,其結果為座標系mxn。 

在這裡,我實際上已經回答了一般人在學習線性代數是最困惑的乙個問題,那就是為什麼矩陣的乘法要規定成這樣。簡單地說,是因為:  

程式設計師的笑話

量子可以用矩陣運動表示,是不可分的最小化單位,能量的整數倍,是不連續的物質,即非線性化

梯度是方向場的變化,是導數也是,斜率

分類聚類區別及聚類概述

一 分類和聚類的區別 分類和聚類的概念是比較容易混淆的。對於分類來說,在對資料集分類時,我們是知道這個資料集是有多少種類的,比如對乙個學校的在校大學生進行性別分類,我們會下意識很清楚知道分為 男 女 而對於聚類來說,在對資料集操作時,我們是不知道該資料集包含多少類,我們要做的,是將資料集中相似的資料...

模式識別 經典聚類方法

基本思想 假設有n個樣本,要求按距離閾值t分類到聚類中心 步驟 step1 將第乙個樣本作為第一類的中心,z1 x1.step2 將剩下的樣本計算 xi z1 若大於閾值t,則xi作為新的一類的中心z2.step3 將剩餘樣本分別計算 xi z1 xi z2 若 xi z1 t且 xi z2 t,則...

分類和聚類的區別

分類 classification 是這樣的過程 它找出描述並區分資料類或概念的模型 或函式 以便能夠使用模型 類標記未知的物件類。分類分析在資料探勘中是一項比較重要的任務,目前在商業上應用最多。分類的目的是學會乙個分類函式或分類模型 也常常稱作分類器 該模型能把資料庫中的資料項對映到給定類別中的某...