大資料架構分析

2022-05-10 10:52:01 字數 829 閱讀 9643

1.典型應用

* ab test 平台 指標計算+指標 orderid, passenger 等.      cube 演算法,快速生成 n 個維度的資料,可隨意的下探上放. 其他細節

見個人日記

* 監控統計

* 報表展現

* 異常檢測 餘弦定理 ,apollo採用箱線圖(boxplot)

2. cboard 前端展現平台, 拖拽

維度就是 mysql 裡的 group by

模擬:www.rowkey.me/blog/2016/08/27/server-basic-tech-stack/

檔案系統:

hdfs

資料庫:

hbase phoenix 提供 sql 操作, join 缺失

計算系統:

hive

sql管理和定時執行平台:

阿里宙斯zeus.(自稱排程,並沒有資源協調功能,有hive本身完成.. )  查詢資料,插入到資料庫中. 資料庫本身提供變動傳送mq.

統計分析和展現平台:

大資料分析神獸麒麟(apache kylin) -- 全套. 含資料抽取 .全量資料統計, 各個維度都幫你計算好 .維度就是 mysql 的 groupby

cboard 展現. 各種圖表 cboard 前端.

zeppeline 類似cbord.

cboard 只是展示, 沒有環比,同比監控.  

open-falcon  cboard

tableau 大資料分析 druid  dataiku 很方便進行資料分析,篩選. 自動化報表查詢,視覺化. 分布餅圖.

大資料架構分析

最近,我再整理學習的大資料的架構知識。大資料,只是的對大量數量的儲存,分析 計算 應用 處理 大資料採取非關係型儲存。monogo居多。比較系統。1.kafak分布式寫入採集系統。2.hbase寫入資訊。3.storm處理資料。4.結果儲存mysql。日誌系統 1.日誌寫入。2.hbase儲存。3....

初探大資料 YARN架構分析 實戰四

yarn架構 1 rm resourcemanager n nm nodemanager resourcemanager的職責 乙個集群active狀態的rm只有乙個,負責整個集群的資源管理和排程 1 處理客戶端的請求 啟動 殺死 3 監控nm 4 系統的資源分配和排程 nodemanager 整個...

大資料之大資料技術架構

上期我們說到大資料的概念,其實,大資料比我們想象中的還要複雜,本期,我們主要從技術的角度介紹一下大資料的知識。大資料技術是一系列技術的總稱,它是集合了資料採集與傳輸 資料儲存 資料處理與分析 資料探勘 資料視覺化等技術,是乙個龐大而複雜的技術體系。根據大資料從 到應用,實現傳輸的流程,可以將大資料技...