論Kafka的整體流程

2021-10-19 09:35:39 字數 454 閱讀 4671

首先需要明確kafka中producer到consumer的各個環節。producer先通過網路傳送到broker,broker會落入磁碟,broker再通過網路傳送到consumer。

先看第乙個環節producer到broker,producer生產資料時,可以選擇單條發給broker,也可以通過批處理提公升速度。在這個環節也可以利用資料壓縮功能。在新的版本中引入了eos,可以逐步處理事務,在此環節引入事務協調者,歸zookeeper管理。

第二個環節broker的落盤,producer傳送到broker後,因為資料需要落盤,為了減少使用者態和核心態的之間的多次拷貝,引入mmap,且在落盤時,為了減少io,這裡引入了page cache。

第三個環節broker到consumer,是通過 nio 的 transferto/transferfrom 呼叫作業系統的 sendfile 實現零拷貝,在這個環節有組協調者,歸zookeeper管理。

專案整體流程

寫這些東西希望能夠給剛剛畢業的大學生在幹軟體專案中加一些指導性的作用,可能不能直接應用,但是每個階段一般是這樣的,如果可以靈活運用的話,問題應該不大 1.確定調研人員和分配任務 a 確定調研 概要設計 詳細設計和程式設計人員 b 寫出工作計畫和工作行程,做好關鍵路徑。2.初步調研 a 確定領導的管理...

MapReduce整體流程

由於map是並行地對輸入的檔案集進行操作,所以它的第一步 filesplit 就是把檔案集分割成一些子集.如果乙個單個的檔案大到它已影響到查詢效率時,它會被分割成一些小的分割體。要指出的是分割這個一步是不知道輸入檔案的內部邏輯結構的,比如,以行為邏輯分割的文字檔案會被以任意的位元組界限分割,所以這個...

Python爬蟲的整體流程

對於爬蟲小白來說,很多人都感覺不知道怎麼開始學習。從網上查來查去,找到的多是部分的 但很少有從整體上闡述爬蟲的流程的,因此導致了很多人對於爬蟲的難以理解和無從下手。接下來就介紹一下爬蟲的整體流程。爬蟲整體上可以分為三個步驟 獲取網頁就是向乙個 傳送request,然後 返回網頁的資料。獲取網頁我們可...