資料探勘和大資料 OLAP 資料統計

2021-09-27 11:20:16 字數 800 閱讀 3302

我們在大資料領域中總是聽說過資料探勘、olap、資料統計等等的專業詞彙。但是很多人對這些詞彙不是很理解,在這篇文章中我們給大家介紹一下資料探勘與大資料、olap、資料統計的相關知識,旨在幫助大家初步地理解這些技術。

1.資料分析的層面

資料分析是乙個大的概念,理論上任何對資料進行計算、處理從而得出一些有意義的結論的過程,都叫資料分析。從資料本身的複雜程度、以及對資料進行處理的複雜度和深度來看,可以把資料分析分為4個層次,分別是資料統計、olap、資料探勘、大資料。

2.資料統計

資料統計就是最基本、最傳統的資料分析,自古有之。是指通過統計學方法對資料進行排序、篩選、運算、統計等處理,從而得出一些有意義的結論。

3.olap

4.資料探勘

資料探勘是指從海量資料中找到人們未知的、可能有用的、隱藏的規則,可以通過關聯分析、聚類分析、時序分析等各種演算法發現一些無法通過觀察圖表得出的深層次原因。針對此可以採取有針對性的管理措施。

5.大資料

大資料是指用現有的計算機軟硬體設施難以採集、儲存、管理、分析和使用的超大規模的資料集。大資料具有規模大、種類雜、快速化、價值密度低等特點。大資料的「大」是乙個相對概念,沒有具體標準,如果一定要給乙個標準,那麼10-100tb通常稱為大資料的門檻。

由此可見,從資料分析的角度來看,目前絕大多數學校的資料應用產品都還處在資料統計和報表分析的階段,能夠實現有效的olap分析與資料探勘的還很少,而能夠達到大資料應用階段的非常少,至少還沒有用過有效的大資料集。

資料探勘和大資料 OLAP 資料統計的區別

我們在大資料的領域中總是聽說過資料探勘 olap 資料統計等等的專業詞彙。這些詞彙如果從字面意義上講,我們很難區分,今天在這篇文章中我們給大家來好好介紹一下資料探勘與大資料 olap 資料統計的區別。首先我們給大家說一下資料分析,資料分析是乙個大的概念,理論上任何對資料進行計算 處理從而得出一些有意...

資料探勘與OLAP

關於資料探勘的作用,berry and linoff的定義儘管有些言過其實,但清晰的描述了資料探勘的作用。分析報告給你後見之明 hindsight 統計分析給你先機 foresight 資料探勘給你洞察力 insight 舉個例子說。你看到孫悟空跟二郎神打仗,然後寫了個分析報告,說孫悟空在柔韌性上優...

大資料OLAP引擎對比

presto 記憶體計算,mpp架構 pb級別資料 presto適合pb級的海量資料查詢分析,不是說把pb的資料放進記憶體,比如一張pb表,查詢count,vag這種有個特點,雖然資料很多,但是最終的查詢結果很小,這種就不會把資料都放到記憶體裡面,只是在運算的過程中,拿出一些資料放記憶體,然後計算,...