flink 保證一致性的 barrier對齊

barrier對⻬齊

1.什麼是barrier對⻬齊？

⼀旦operator從輸⼊入流接收到checkpoint barrier n，它就不能處理理來⾃該流的任何資料記錄，直到它從其他所有輸入接收到barrier n為止。否則，它會混合屬於快照n的記錄和屬於快照n + 1的記錄接收到barrier n的流暫時被擱置。從這些流接收的錄不會被處理，⽽是放⼊輸⼊緩衝區。

⼀旦最後所有輸入流都接收到barrier n，operator就會把緩衝區中pending 的輸出資料發出去，然後把checkpoint barrier n接著往下游傳送這里還會對⾃身進行快照之後，operator將繼續處理理來⾃所有輸⼊流的記錄，在處理來⾃流的記錄之前先處理來⾃輸⼊緩衝區的記錄

2.什麼是barrier不對齊？

barrier不對齊就是指當還有其他流的barrier還沒到達時，為了不影響效能，也不⽤理會，直接處理barrier之後的資料。等到所有流的barrier的都到達後，就可以對該operator做checkpoint了了

為什麼要進行barrier對齊？不對齊到底⾏不行？

答：exactly once時必須barrier對⻬齊，如果barrier不對⻬齊就變成了at least once

後⾯的部分主要證明這句話checkpoint的⽬的就是為了儲存快照，如果不對齊，那麼在chk-100快照之前，已經處理了⼀些chk-100 對應的offset之後的資料，當程式從chk-100恢復任務時，chk-100對應的offset之後的資料還會被處理一次所以就出現了重複消費。如果聽不懂沒關係，後⾯有案例讓您懂結合pv案例來看，之前的案例為了簡單，描述的kafka的topic只有1個partition，這⾥裡為了講述barrier對齊，所以topic有2個partittion

flink 保證一致性的 barrier對齊

保證一致性嗎 Kafka的一致性保證

Flink 狀態一致性

flink 狀態一致性（十三）

flink 保證一致性的 barrier對 齊

保證一致性嗎 Kafka的一致性保證

Flink 狀態一致性

flink 狀態一致性（十三）

相關推薦

flink 保證一致性的 barrier對齊