Hadoop技術 大資料概論

2021-10-06 20:37:08 字數 1634 閱讀 3859

三、大資料應用場景

四、業務流程分析

大資料就是巨量的資料。大資料的計量單位已經超過tb級別發展到pb、eb、zb、yb甚至bb級別。

大資料是指在一定時間內無法使用傳統資料庫軟體工具採集、儲存、管理和分析其內容的資料集合。

大資料技術的戰略意義不在於掌握龐大的資料資訊,而在於對於這些含有意義的資料進行專業化處理。

大資料具有5各方面的特點,規模性(volume)、多樣性(variety)、高速性(velocity)、價值性(value)、真實性(veracity)。

資料規模大

大資料可以分為三類:

1.結構化資料,指可以使用關係型資料庫表示和儲存,表現為二維形式的資料。一般特點是:資料以行為單位,一行資料表示乙個實體的資訊,每行資料的屬性是相同的。

2.非結構化資料,指的是資料結構不規則或不完整,沒有預定義的資料模型,不方便用資料庫二位邏輯表來表現得資料。

3.半結構化資料,是結構化資料的一種,不符合關係型資料庫或其他資料表的形式關聯起來的資料模型結構,但包含相關標記,用來分隔語義元素以及對記錄和字段進行分層。因此,它也被稱為自描述的結構。半結構化資料,屬於同一類實體可以有不同的屬性,即使他們被組合在一起,這些屬性的順序並不重要。

結構化資料佔比比較大,但是產生價值的往往是這些非結構哈u資料。

資料的增長速度和處理速度是大資料高速性的重要體現。

海量資料的背後帶來的是更大的挑戰,即如何快速計算分析大資料成為當下熱門的話題。

大資料的核心特徵是價值。價值密度的高低和資料總量的大小是成反比的,即資料價值密度越高資料總量越小,資料價值密度越低資料總量越大。

真實性就是資料的質量。

精準營銷法寶

大資料在金融行業的應用可以總結一下五個方面:精準營銷、風險管控、決策支援、效率提公升以及產品設計。

了解客戶消費喜好和趨勢,進行商品的精準營銷,降低營銷成本。依據客戶購買產品,為客戶提供可能購買的其他產品,擴大銷售額,也屬於精準營銷範疇。

1.產品人員提需求:統計總使用者數、日活躍使用者數、回流使用者數等

2.資料部門搭建資料平台、分析資料指標

3.資料視覺化(報表展示、郵件傳送、echarts)

Hadoop系列001 大資料概論

大資料 big data 指無法在一定時間範圍內用常規軟體工具進行捕捉 管理和處理的資料集合,是需要新處理模式才能具有更強的決策力 洞察發現力和流程優化能力的海量 高增長率和多樣化的資訊資產。最小的基本單位是bit,按順序給出所有單位 bit byte kb mb gb tb pb eb zb yb...

大資料技術概論習題(5)

1 觀察離散資料分布的常用方法是 a a 直方圖 b 餅圖 c 密度圖 d 箱線圖 2交叉分析是基於 橫向地組合交叉。a 同一緯度 b 不同維度 c 同一方向 d 以上都不是 3離散型隨機變數的可能值為 c a 乙個區間 b 無限個 c 有限個數 d 1個 4以下不屬於資料分析時用到的方法是 c a...

大資料技術之Hadoop解析

大資料技術之hadoop解析。1 資料現狀 2006年數字世界 digital universe 專案統計得出全球資料總量為0.18zb,2011年將達到1.8zb 1zb 1 000eb 1 000 000pb 1 000 000 000tb 資料增長速度也在加快。2 資料的儲存 資料讀取速度慢 ...