特徵選擇和特徵學習中的過完備

scspm的**中提到了碼書的過完備（over-complete）。一開始沒有太在意過完備有什麼問題，今天想了想把這個概念弄明白了。

特徵學習的過程中，假設學習的碼書d的大小為m。每個碼字的維數為n。每個原始特徵yi的維數也為n。假設原始特徵投影到碼書上以後的特徵向量是xi（m維的向量），那麼用d和xi對yi重建的過程就是：yi=d*xi。

coding的過程就變成了已知yi和d，求xi的過程了。顯然這是乙個非齊次方程組求解的問題，方程組有解的條件是rank(d)≤m，其中取等號時方程組有唯一解。過完備的定義是m>>n，所以此時rank(d)≤n這裡和這裡）中稍微介紹過，這裡就不再廢話。

特徵選擇的過程，也是一樣的。假設此時有n個樣本，每個樣本有個measurement（這個measurement可以是regression中的output，也可以是classification中的label）。每個樣本的特徵是p維的，n個樣本的特徵組成n*p的矩陣a。目標是對這p維特徵做乙個選擇，選擇的係數用x記錄。此時將如下圖所示：

這與第乙個圖是等價的，特徵選擇過程中的over-complete是指p>>n，不加約束的情況下x將有無窮多組解，所以和特徵學習一樣，加係數的約束。xi為0表示相應的特徵不被選擇。（而xi<0，等價於取乙個|xi|，而將相應的特徵的值取負號。）

如果measurement不是一維的咋辦？比如multi-label的問題。我猜測把x的列維數也擴充套件成相應大小，然後根據label之間的correlation加低秩等約束吧。

特徵選擇和特徵學習中的過完備

特徵選擇和特徵抽取

機器學習中特徵降維和特徵選擇的區別

機器學習特徵選擇

特徵選擇和特徵學習中的過完備

特徵選擇和特徵抽取

機器學習中特徵降維和特徵選擇的區別

機器學習 特徵選擇

相關推薦

機器學習特徵選擇