大資料平台與kafka

2021-10-04 04:22:33 字數 436 閱讀 7085

為什麼大資料平台需要引入kafka呢?是用來解決什麼問題呢?

我讀到一篇文章,秒速的很好,這裡引入,作為筆記記錄一下

場景一:我們開發過乙個裝置資訊挖掘平台。這個平台需要實時將採集網際網路關採集到的路由節點的狀態資訊存入資料中心。通常乙個閘道器一次需要上報幾十甚至幾百個變化的路由資訊。全區有幾萬個這種網際網路關。當資訊採集平台將這些變化的資料資訊寫入或更新到資料庫時候,會給資料庫**非常大的壓力,甚至可以直接將資料庫搞掛掉。這就對我們的資料採集系統提出了很高的要求。如何穩定高效地把訊息更新到資料庫這一要求擺了出來。

為了解決以上場景提出的問題,我們需要這樣乙個訊息系統:

緩衝能力,系統可以提供乙個緩衝區,當有大量資料來臨時,系統可以將資料可靠的緩衝起來,供後續模組處理

訂閱、分發能力,系統可以接收訊息可靠的快取下來,也可以將可靠快取的資料發布給使用者

大資料平台搭建 kafka集群的搭建

本系列文章主要闡述大資料計算平台相關框架的搭建,包括如下內容 kafka是乙個分布式 分割槽的 多副本的 多訂閱者的訊息佇列,以高吞吐量著稱,主要用於實時資料的傳輸和處理,總體架構如下 本文環境列表 直接在伺服器10.20.112.59上解壓 cd tar zxvf kafka 2.11 0.10....

大資料平台容量評估 大資料平台

系統概述 大資料應用支撐平台提供資料支撐服務,對外發布資料服務進行資料價值變現。包含資料採集 資料治理 資料交換 資料儲存 資料計算相關元件的搭建 驗證,並建立大資料倉儲。b 功能要求 2.資料治理,由於從資料採集工具採集過來的資料不具備統一的資料標準及資料格式,資料治理工具需要對到達的資料進行格式...

大資料(Kafka) 原理

在kafka中向topic傳送訊息者稱為producer,從topic獲取資料者稱為consumer,consumer被定義到乙個consumer group中,整個kafka集群通過zookeeper進行協調 kafka集群由多個broker例項組成,訊息按照topic進行分類儲存,每個topic...