Kafka工作流程及檔案儲存機制

2021-10-11 09:46:02 字數 1481 閱讀 8906

kafka 中訊息是以 topic 進行分類的,生產者生產訊息,消費者消費訊息,都是面向 topic的。

topic 是邏輯上的概念,而 partition 是物理上的概念,每個 partition 對應於乙個 log 文

件,該 log 檔案中儲存的就是 producer 生產的資料。producer 生產的資料會被不斷追加到該

消費到了哪個 offset,以便出錯恢復時,從上次的位置繼續消費。

開啟集群後建乙個topic

kafka-topics.sh --zookeeper hadoop01:2181 --create --replication-factor 3 --partitions 1 --topic mytest
3個副本表示1個leader和2個follower

每個副本都只有乙個分割槽

進入剛才生成的唯一 乙個分割槽後,分別是

00000000000000000000.index  

00000000000000000000.log

00000000000000000000.timeindex

leader-epoch-checkpoint

「.index」檔案儲存大量的索引資訊

「.log」檔案儲存大量的資料

producer向mytest2中傳輸資料2次資料

第一次在第乙個分割槽中存放nihao

第二次是存放在第二個分割槽

所以kafka其實預設的分割槽傳輸資料規則是roundrobin strategy(輪詢的消費策略)

另外還有一種range startegy(根據範圍消費)

Kafka工作流程及檔案儲存機制

一 基礎架構 1 kafka中訊息是以topic進行分類的,生產者生產訊息,消費者消費訊息,都是面向topic的。2 topic是邏輯上的概念,而partition是物理上的概念 3 每個partition對應於乙個log檔案,該log檔案中儲存的就是producer生產的資料 log檔案的儲存位置...

Kafka工作流程以及檔案儲存機制分析

kafka中訊息是以topic進行分類的,生產者生產訊息,消費者消費訊息,都是面向topic的。由於生產者生產的訊息會不斷追加到log檔案末尾,為防止log檔案過大導致資料定位效率低下,kafka採取了分片和索引機制,將每個partition分為多個segment。每個segment對應兩個檔案 i...

Kafka學習筆記(四)工作流程

1.生產者定期向主題傳送訊息。2.kafka 儲存為該特定主題配置的分割槽中的所有訊息。它確保訊息在分割槽之間平等共享。如果生產者傳送兩個訊息並且有兩個分割槽,kafka將在第一分區中儲存乙個訊息,在第二分割槽中儲存第二訊息。3.消費者訂閱特定主題。4.一旦消費者訂閱主題,kafka將向消費者提供主...