機器學習基礎概念筆記

2022-08-24 08:09:16 字數 394 閱讀 2756

監督學習:分類和回歸屬於監督學習。這類演算法必須知道**什麼,即目標變數的分類資訊。

常見演算法:k-近鄰演算法、線性回歸、樸素貝葉斯演算法、支援向量機、決策樹、lasso最小回歸係數估計、ridge回歸、區域性加權線性回歸

無監督學習:資料沒有類別資訊,不給定目標值。

常見演算法:k-均值、最大期望演算法、dbscan、parzen窗設計

機器學習應用步驟:

收集資料——準備輸入資料——分析輸入資料——訓練演算法——測試演算法——使用演算法

另一種框架:

訓練集——提取特徵向量—— 結合一定的演算法 ——得到結果

分類和回歸演算法的評估:

1、準確率    2、速度    3、強壯性    4、可解讀性

分類:類別型

回歸:連續數值型

機器學習基礎概念

聚類 將本身沒有類別的樣本聚集成不同的組,這樣的一組資料物件的集合叫做簇,並且對每乙個這樣的簇進行描述的過程,他的目的是使得屬於同乙個簇的樣本之間應該彼此相似,而不同簇的樣本應該足夠不相似。資料預處理 在資料探勘之前使用,大大提高了資料探勘的質量 處理缺失值 將含有缺失值的記錄刪除 根據變數之間的相...

機器學習基礎概念

資料量大 tb pb eb zb yb hdfs 速度快 資料增長速度快 資料處理速度快 價值密度低 密度 有價值資料 all 機器學習演算法解決 人工智慧 機器學習 深度學習的關係 資料 資料分析 資料探勘 機器學習 致力於研究如何通過cpu和gpu 圖形處理器 的計算,利用經驗 資料來改善 計算...

機器學習概念筆記

1.1若 離散值,此類學習任務稱為 分類 若 連續值,此類學習任務稱為 回歸 1.2此外還可以進行 聚類 即將訓練集中的物件分成若干組,每組稱為乙個 簇 這些自動形成的簇可能對應一些潛在的概念劃分。2.1根據訓練資料是否擁有標記資訊,學習任務可大致劃分為兩大類 監督學習 和 無監督學習 分類和回歸是...