Laplacian score 用於特徵選擇

2022-07-23 21:00:33 字數 1082 閱讀 6604

監督學習,過濾,特徵加權

第乙個問題就是,怎樣定義乙個"好的"的特徵?

首先我們尊重資料,資料是大爺,所以乙個好的特徵得到的結果應該和資料相吻合。即如果原資料中兩點相近,那麼在該特徵下兩點也應該相近。

其次,好的特徵應該能將類之間分開,那麼如果乙個特徵的跨度越到,我們認為這個特徵就就具有好的分類特性,衡量這個跨度的就是方差,所以就要有乙個大的方差。

laplacian score 的方法這樣定義乙個特徵的權重值,

其中其中t 為乙個給定值

為什麼會有sij?

我認為sij 度量的是xi 和xj 之間的距離,所以就為分析某乙個特性的時候帶入了整體感……

下面再化簡

根據乙個叫做spectral graph thery 的理論可以用對焦矩陣d來估計

所以就有

可以證明

所以所以laplacian score的演算法流程為

step1 : 用所有的資料建立乙個圖,將相鄰的兩個點相連。兩個點

是相連的,如果

step2 : 計算

。對於相鄰的兩點

其中 t是給定的乙個值,

step3 :對於第r個特徵,,

;step4 : 最後

總結:laplacian score 演算法可以說是fisher score的推廣情況。這個演算法比較有效的衡量了各個特徵的權重,優先選擇權重比較小的那些。但是這個演算法沒有衡量各個特之間相互的硬性,有可能會選取冗餘特徵。

用Margin還是用Padding

用margin還是用padding 何時應當使用margin 需要在border外側新增空白時。空白處不需要背景 色 時。上下相連的兩個盒子之間的空白,需要相互抵消時。如15px 20px的margin,將得到20px的空白。何時應當時用padding 需要在border內測新增空白時。空白處需要背...

用Margin還是用Padding

用margin還是用padding這個問題是每個學習css高階時的必經之路。css邊距屬性定義元素周圍的空間。通過使用單獨的屬性,可以對上 右 下 左的外邊距進行設定。也可以使用簡寫的外邊距屬性同時改變所有的外邊距。w3school 邊界 margin 元素周圍生成額外的空白區。空白區 通常是指其他...

用yaml寫用例

第一步 安裝yaml,在執行裡輸入 pip install pyyaml 檢驗是否安裝成功,在pycharm裡輸入 import yaml 第二步 建立乙個file,字尾寫yaml或yml 在yml檔案裡寫入單個使用者名稱和密碼 開啟yml檔案並以字典的形式列印出來 執行結果 在yml檔案裡寫入多個...