資料探勘的任務,主要有哪些?

2021-09-14 07:15:04 字數 1072 閱讀 2384

關聯分析(association analysis)

關聯規則挖掘由rakesh apwal等人首先提出。兩個或兩個以上變數的取值之間存在的規律性稱為關聯。資料關聯是資料庫中存在的一類重要的、可被發現的知識。關聯分為簡單關聯、時序關聯和因果關聯。關聯分析的目的是找出資料庫中隱藏的關聯網。一般用支援度和可信度兩個閥值來度量關聯規則的相關性,還不斷引入興趣度、相關性等引數,使得所挖掘的規則更符合需求。

聚類分析(clustering)

聚類是把資料按照相似性歸納成若干類別,同一類中的資料彼此相似,不同類中的資料相異。聚 類分析可以建立巨集觀的概念,發現資料的分布模式,以及可能的資料屬性之間的相互關係。

分類(classification)

分類就是找出乙個類別的概念描述,它代表了這類資料的整體資訊,即該類的內涵描述,並用這 種描述來構造模型,一般用規則或決策樹模式表示。分類是利用訓練資料集通過一定的演算法而求得分類規則。分類可被用於規則描述和**。

**(predication)

**是利用歷史資料找出變化規律,建立模型,並由此模型對未來資料的種類及特徵進行**。 **關心的是精度和不確定性,通常用**方差來度量。

時序模式(time-series pattern)

時序模式是指通過時間序列搜尋出的重**生概率較高的模式。與回歸一樣,它也是用己知的資料**未來的值,但這些資料的區別是變數所處時間的不同。

偏差分析(deviation)

在偏差中包括很多有用的知識,資料庫中的資料存在很多異常情況,發現資料庫中資料存在的異常情況是非常重要的。偏差檢驗的基本方法就是尋找觀察結果與參照之間的差別。

人工智慧、大資料、雲計算和物聯網的未來發展值得重視,均為前沿產業,多智時代專注於人工智慧和大資料的入門和科譜,在此為你推薦幾篇優質好文:

大資料的背景下,採用的大資料與資料探勘有什麼本質上的不同?

資料分析與資料探勘的區別和聯絡?

如何通過自學,成為資料探勘「高手」?

多智時代-人工智慧和大資料學習入門**|人工智慧、大資料、物聯網、雲計算的學習交流**

大資料常用的挖掘方法,主要有哪些?

神經網路方法 神經網路由於本身良好的魯棒性 自組織自適應性 並行處理 分布儲存和高度容錯等特性非常適合解決資料探勘的問題,因此近年來越來越受到人們的關注。典型的神經網路模型主要分3大類 以感知機 bp反向傳播模型 函式型網路為代表的,用於分類 和模式識別的前饋式神經網路模型 以hopfield的離散...

seo優化方法主要有哪些

seo優化方法主要有哪些 很多seo新手其實都想知道seo優化的方法,但是這個問題其實很廣泛,看著是乙個很簡單表面的問題,其實這個需要我們剖析,以下是中安雲城列出比較基礎的方法。3.網域名稱和空間 要想優化好乙個 從 的初期就要做好各項優化準備,包括網域名稱和空間相關的知識,也是需要學習的,乙個好的...

常見的定位技術主要有哪些?

目前,常見的定位技術主要有 藍芽 rfid wifi 超寬頻 uwb 超聲波等。智物達 智尋 超寬頻 uwb 定位系統是一種以極低功率在短距離內高速傳輸資料的無線定位技術。uwb技術 超寬頻 uwb 無線定位技術由於功耗低 抗多徑效果好 安全性高 系統複雜度低,尤其是能提供非常精確的定位精度等優點,...