Apache Flink 漫談系列 01 序

2021-09-19 21:57:59 字數 1186 閱讀 6885

apache flink 漫談系列 分享的內容和觀點與任何公司,組織無關,僅代表我個人的認知,純屬技術愛好的分享!

本人 孫金城,**花名"金竹",阿里巴巴高階技術專家,apache flink committer。目前就職於阿里巴巴計算平台事業部,自2023年以來一直投入於基於apache flink的設計研發工作。

apache flink 漫談系列會分享什麼呢?本系列分享的核心內容會圍繞 apache flink的核心特徵以及阿里巴巴對apache flink功能的豐富和效能、架構的優化進行深入剖析,從系統架構到具體每個運算元的語義都會向讀者進行細緻分享,並且以**和具體示例的方式講解具體運算元的實現原理。

apache flink是時代的產物,是當前純流式計算引擎的領頭羊。最初apache flink的名字叫stratosphere,是位於德國柏林的一所大學的幾個博士和研究生發明的,很短的時間便於2023年3月份成為apache incubator project。

apache flink 於2023年在德國berlin舉行了第一次flink forward。也是在2023年阿里巴巴的 蔣曉偉 也在帶領團隊將apache flink的應用到alibaba業務生態中。並於2023年的flink forward上面對apache flink在alibaba生態的應用進行了分享。此後apache flink在流計算領域風靡至今,blink也在2015,2016,2017的阿里巴巴雙十一狂歡節中創造了很多奇蹟,其中 2023年雙11創下了每秒處理4.72億實時日誌,每秒32.5萬筆支付交易的佳績。

目前業界大量的使用者對apache flink 抱有濃厚的學習興趣。所以本系列專題應需而生,目的在於向廣大使用者和apache flink愛好者深入全面的分析apache flink的實現原理,讓更多的人更好的了解apache flink,並能在apache flink中得到更大的利好。

apache flink 漫談系列什麼時候會完成呢? 我想本系列會隨著apache flink的不斷發展而一直持續下去,除非我不再從事apache flink的研究,否則我會盡力定期為大家更新分享。

apache flink 漫談系列內容如何安排? 根據目前的情況本系列第一篇分享是《apache flink漫談系列 - 概述》,內容會包含apache flink的整體架構、執行模型、各個模組的作用以及模組之間的關係。然後後續會介紹apache flink的技術原理和具體的使用、實現細節,分享內容會不定時的進行更新。

Apache Flink 環境搭建

筆者直接在docker上搭建的flink環境 先到瀏覽了flink官網的文件,最新的穩定版本是1.10.0 然後到dockerhub搜尋flink 上面直接有flink容器的docker compose的的配置。直接copy下來。這裡我選擇的版本flink 1.10.0 scala 2.11 ver...

Apache Flink 記憶體管理

jvm flink的記憶體管理 序列化與反序列化可以理解為編碼與解碼的過程。序列化以後的資料希望占用比較小的空間,而且資料能夠被正確地反序列化出來。為了能正確反序列化,序列化時僅儲存二進位制資料本身肯定不夠,需要增加一些輔助的描述資訊。此處可以採用不同的策略,因而產生了很多不同的序列化方法。j a本...

漫談系列 大數定律

今天我們聊聊大數定律 law of large numbers,lln 這個概率論中的重要基石。最後面有一道測試題,有興趣的同學可以挑戰看看 大數定律講了一件什麼事情?簡單的來講,它告訴我們在隨機事件的大量重複出現中,往往呈現幾乎必然的規律。在試驗不變的條件下,重複試驗多次,隨機事件的概率近似於它出...