資料探勘能做什麼

2021-09-30 16:25:57 字數 800 閱讀 1030

資料探勘不僅能對過去的資料進行查詢和遍歷,並且能夠對將來的趨勢和行為進行**,並自動探測以前未發現的模式,從而很好地支援人們的決策。被挖掘出來的資訊,能夠用於資訊管理、查詢處理、決策支援、過程控制以及許多其它應用。資料探勘按其功能劃分主要包括以下幾類:

(1) 分類

分類是資料探勘中應用的最多的方法。分類是找出乙個類別的概念描述,它代表了這類資料的整體資訊,即該類的內涵描述,一般用規則或決策樹模式表示。乙個類的內涵描述分為特徵性描述和區別性描述。特徵性描述是對類中物件的共同特徵的描述,區別性描述是對兩個或多個類之間區別的描述。

(2) 關聯分析

若兩個或多個資料項的取值重複出現且概率很高時,它就存在著某種關聯,可以建立起這些資料項的關聯規則。關聯分析的目的是找出資料庫中隱藏的關聯網。在大型資料庫中,這種關聯規則是很多的,一般用「支援度」,「可信度」兩個閾值來淘汰那些無用的關聯規則。

(3) 聚類

資料庫中的資料可分為一系列有意義的子集或稱為類。在同一類別中,個體之間的距離較小,而不同類別的個體之間的距離偏大。聚類增強了人們對客觀現實的認識,即通過聚類建立巨集觀概念。

(4)序列模式

通過時間序列搜尋出重**生概率較高的模式,這裡強調時間序列對挖掘結果的影響。

(5)偏差檢驗

資料庫中的資料常有一些異常記錄,從資料庫中檢測出這些偏差很有意義。偏差包括很多潛在的知識,如分類中的反常例項、不滿足規則的特例、觀測結果與模型**值的偏差、量值隨時間的變化等。偏差檢測的基本方法是尋找觀測結果與參照之間的差別。

(6) **

**是利用歷史資料找出變化規律,即建立模型,並用此模型來**未來資料的種類、特徵等。

大資料能做什麼

技術角度的大資料。原始出處 作者資訊和本宣告。否則將追究法律責任。hadoop和大資料是這兩年最火的詞兒們之一,越來越多的公司對這個東西感興趣,但是我接觸到的大多數公司裡的人,無論是技術人員還是老闆。都不知道怎麼能把這些東西用於改善自己公司的業務。在解答的過程中,提煉出幾個要點,記錄一下。大資料和雲...

大資料能做什麼

hadoop和大資料是這兩年最火的詞兒們之一,越來越多的公司對這個東西感興趣,但是我接觸到的大多數公司裡的人,無論是技術人員還是老闆。都不知道怎麼能把這些東西用於改善自己公司的業務。在解答的過程中,提煉出幾個要點,記錄一下。大資料和雲是不是一回事?這是最容易混淆的概念之一,我個人認為這是兩回事,雲服...

大資料能做什麼?

什麼是大資料?大資料是需要新處理模式才能具有更強的決策力 洞察發現力和流程優化能力的海量 高增長率和多樣化的資訊資產。新處理模式具有兩層含義 1 由於海量資料,需要更高效的儲存和處理技術,hadoop。2 大資料明顯標誌是資料探勘和人工智慧的緊密結合。資料統計只是對已有的資料進行縱向歸類,大資料是基...