資料探勘概念

2021-09-24 17:07:06 字數 660 閱讀 3199

•資料探勘是從海量的資料中抽取感興趣的(有價值的、隱含的、以前沒有用但是潛在有用資訊的)模式和知識的過程。

•資料探勘是從存放在資料庫、資料倉儲中或其它資訊庫中的大量資料中挖掘有趣知識的過程。

研究計算機怎樣模擬或實現人類的學習行為,以獲取新的知識或技能,重新組織已有的知識結構使之不斷改善自身的效能。

分類:

監督學習,無監督學習,半監督學習,主動學習:

•監督學習:

定義:通過對大量已知分類或輸出結果值的例項進行訓練,調整模型的結構,達到建立能夠準確分類或**未知模型的目的。這種基於歸納的概念學習過程被稱為有指導(監督)的學習。

•無監督學習:

在學習訓練之前,無預先定義好分類的例項,資料例項按照某種相似性度量方法,計算例項之間的相似程度,將最為相似的例項聚類在乙個組——簇(cluster)中,再解釋和理解每個簇的含義,從中發現聚類的意義。

•半監督學習:

是監督學習與無監督學習相結合的一種學習方法。

半監督學習使用大量的未標記資料,以及同時使用標記資料,來進行資料探勘工作。

標記的例項用來學習模型,未標記的資料用來改進類邊界。

•主動學習:

主動學習通過一定的演算法查詢最有用的未標記樣本,並交由專家進行標記,然後用查詢到的樣本訓練分類模型來提高模型的精確度.

資料探勘概念複習

資料探勘側重應用,理論不是很難理解,快考試了,回顧一下常見的概念。資料探勘其實就是在一堆資料裡找規律來 資料探勘的過程主要有資料準備和資料探勘,資料準備的過程很重要,甚至超過了挖掘,涉及到的概念有資料倉儲 資料整合 資料探勘主要解決四類問題 分類問題 聚類問題 關聯問題 問題。資料倉儲其實也是乙個資...

資料探勘概念與技術 文字挖掘

1 文字檢索的基本度量 color red 準確率和召回率 color url 2 文字檢索方法 color red 向量空間模型 color url 3 文字索引技術 color red 1 倒排索引 color 一種索引結構,維持兩個雜湊索引表document table 文件表 和term t...

資料探勘之基礎概念

任務 根據其他屬性的值,特定屬性的值。通常資料探勘的任務 描述任務 匯出概括資料中潛聯絡的模式 四種主要的資料探勘任務 建模 關聯分析 聚類分析 異常檢測 建模 分類 用於 離散的目標變數 回歸 用於 連續的目標變數 關聯分析 用於發現描述資料中強關聯特徵的模式。異常檢測 識別器特徵顯著不同於其他資...