大資料處理技術 基礎介紹

2021-09-11 02:41:53 字數 468 閱讀 8220

1. 5個v

(1) volume 高容量

(2)velocity 高速度

(3)variety 多樣性

(4)veracity  真實性

(5)value 價值性

2. 工作

(1)儲存

(2)管理

(3)分析 (這裡主要講這個)

3.大資料分析

通過對大量資料進行分析,挖掘發現其中的模式和模型。

(1)valid:對新資料有效

(2)useful:能在一定程度上方便對item進行決策

(3)unexpected:模式/模型不易被觀察到

(4)understandable:人們能夠對模式進行解釋

4.資料分析任務

(1)描述方法

找到人類可解釋的模式來描述資料,如:聚類

(2)**方法

使用一些已知變數來**未知的變數,如:推薦系統

大資料處理技術之資料整合

大資料處理技術是乙個十分重要的工作,就好比做菜,我們做菜之前就需要對蔬菜進行清洗,洗過的菜我們才能夠吃的放心,同時還有助於我們的身體健康。而大資料處理就好比清洗蔬菜一樣,當我們對資料整理以後,我們才能夠分析出乙個準確的結果。而大資料處理的技術有很多,其中最常見的就是資料整合,那麼什麼是資料整合呢?下...

大資料處理

大資料處理的流程主要包括以下四個環節 採集 匯入 預處理 統計 分析 挖掘,下面針對這四環節進行簡單闡述。大資料處理之一 採集 在大資料的採集過程中,其主要特點和挑戰是併發數高,因為同時有可能會有成千上萬的使用者來進行訪問和操作,比如火車票售票 和 它們併發的訪問量在峰值時達到上百萬,所以需要在採集...

大資料處理技術之冗餘消除

我們在分析資料的時候,需要對資料進行整理,這樣就能夠方便資料分析工作。當然,資料加工是資料分析工作之前的工作,而在大資料處理中有很多資料整理的技術,其中最常見的就是冗餘消除,那麼什麼是資料冗餘呢?在這篇文章中我們就詳細地給大家解答一下這個問題。而對於普通的資料傳輸和儲存,這就涉及到了乙個技術,那就是...