《資料蜂巢架構演進之路》 閱讀

2022-04-10 09:57:19 字數 773 閱讀 5637

該文章一開始列出各業務系統為使用mysql的業務資料,重複開發出多套資料同步工具,一方面難以管理,另外部分工具效能也偏差。需要乙個統一為mysql資料提供同步服務的平台。該平台需支援離線同步,實時訂閱,實時同步三大基本功能等。

那各功能如何實現?離線同步:可理解為將根據乙個sql查詢出的資料同步到其它目標儲存上;實時訂閱:通過實時解析mysql-binlog,將資料的變動封裝成事件存於訊息佇列,供使用者訂閱消費;實時同步:提供一些常見的訂閱客戶端料現,實時消費訊息,將資料的變動應用於目標儲存上。

如何將三個功能整合在乙個平台架構下?將離線同步,實時訂閱,實時同步三個需求抽象為三種作業,分別為batchjob,streamjob,piejob。

i. batchjob參考sqoop的模式,將需同步的資料先根據指定的規則進行分片,然後將作業根據分片拆分成多個任務,每個任務只同步本分片的資料,多個任務可同時執行,以加快同步效率;ii. 以batchjob的模式為基礎,streamjob也可根據需要採集的mysql例項分成多個任務,每個任務負責採集解析乙個mysql的binlog,並將解析後的事件封裝成訊息存於本地供訂閱者消費;iii. piejob是對訂閱客戶端的封裝,每乙個訂閱客戶端即可看作乙個任務。

三種不同的作業最終都可以通過分片分成多個任務去執行,使用統一的模型。

文章最後介紹了集群此昂管內容,這也是我們近期有過接觸的內容。

集群的1、高可用2、資料本地性3、負載均衡解決了很多問題。

《京東咚咚架構演進》 閱讀

大家對咚咚有什麼了解?認識他嗎?咚咚之於京東相當於旺旺之於 它們都是服務於買家和賣家的溝通。自從京東開始為第三方賣家提供入駐平台服務後,咚咚也就隨之誕生了。3.0爆發 服務化的第乙個問題如何把乙個大的應用系統切分成子服務系統。這次考慮系統穩定性 可用性方面的改進公升級,單獨儲存量上也做了改進,但之後...

運滿滿的技術架構演進之路

目前運滿滿有 520w 司機和 125w 貨主使用者。貨運行業有其特殊性,我們也很榮幸能採訪到運滿滿 cto 王東老師,從運滿滿最初的架構迭代,到技術中颱的搭建,到當前的 ai 技術的應用,整體上了解貨運平台的技術積累。同時,王東老師也會在 7 月 6 日的深圳 archsummit 全球架構師技術...

運滿滿的技術架構演進之路

目前運滿滿有 520w 司機和 125w 貨主使用者。貨運行業有其特殊性,我們也很榮幸能採訪到運滿滿 cto 王東老師,從運滿滿最初的架構迭代,到技術中颱的搭建,到當前的 ai 技術的應用,整體上了解貨運平台的技術積累。同時,王東老師也會在 7 月 6 日的深圳 archsummit 全球架構師技術...