機器學習2 4 特徵學習

2022-09-10 02:48:20 字數 677 閱讀 3596

需要利用手動特徵工程從原始資料的領域知識建立特徵(stage1),然後再部署相關的機器學習演算法的都不是特徵學習(stage2),像svm、決策樹、k鄰近演算法、隨機森林都不是,他們的定位應該是在stage2部分

特徵學習可以被分為兩類:監督式特徵學習(supervised representation learning)和無監督式特徵學習(unsupervised representation learning)。

在監督特徵學習中,被標記過的資料被當做特徵用來學習。例如神經網路(neural networks),多層感知器(multi-layer perception),監督字典學習(supervised dictionary learning)。

在無監督特徵學習中,未被標記過的資料被當做特徵用來學習。例如無監督字典學習(unsupervised dictionary learning),主成分分析(principal component analysis),獨立成分分析(independent component analysis),自動編碼(auto-encoders),矩陣分解(matrix factorization) ,各種聚類分析(clustering)及其變形。

機器學習 特徵選擇

特徵選擇是特徵工程中的重要問題 另乙個重要的問題是特徵提取 坊間常說 資料和特徵決定了機器學習的上限,而模型和演算法只是逼近這個上限而已。由此可見,特徵工程尤其是特徵選擇在機器學習中占有相當重要的地位。通常而言,特徵選擇是指選擇獲得相應模型和演算法最好效能的特徵集,工程上常用的方法有以下 1.計算每...

機器學習 特徵工程

老師有多年的網際網路從業經驗,所以講解的過程中結合了很多任務業界的應用,更加的深入淺出。資料採集 資料採集前需要明確採集哪些資料,一般的思路為 哪些資料對最後的結果 有幫助?資料我們能夠採集到嗎?線上實時計算的時候獲取是否快捷?舉例1 我現在要 使用者對商品的下單情況,或者我要給使用者做商品推薦,那...

機器學習 特徵工程

資料和特徵決定了機器學習的上限,而模型和演算法只是逼近這個上限而已。通俗的說,就是盡可能的從原始資料中獲取更多資訊,從而使得 模型達到最佳。簡而言之,特徵工程是乙個把原始資料變成特徵的過程,這些特徵可以很好的描述資料,並且利用它們建立的模型在未知資料上表現效能可以達到最優。實驗結果取決於獲取的資料 ...