eBay的分布式資料訪問實踐

2021-08-26 21:32:38 字數 642 閱讀 3301

ebay的分布式資料訪問實踐 

由祝文兵講解的《ebay的分布式資料訪問實踐》實際上就是乙個資料訪問中間層與之前曹政講的《分布式資料庫及反正規化設計》有相似之處,下面我將大會上的簡要內容加上我個人的一些理解與大家進行分享。

此資料庫訪問中間層實際上就是水平劃分多個資料庫,根據不同的策略選擇不同的資料來源進行操作。

具體選擇策略有以下二種方法如下:

1、主鍵是字元型,根據"id(序列)%資料庫個數"來確定將資料插入到哪個庫中,然後將主鍵定義為:id序列+數 據庫編號。

2、隨機輪詢多個資料庫,隨機抽取乙個資料庫出來,供插入資料,然後修改主鍵為:id序列+資料庫編號。

3、根據使用者id%資料庫個數來選取不同的資料庫,這樣使用者就固定在某個資料庫中,也就是根據使用者來劃分資料庫,在資料庫中有一張路由表,字段大概是使用者id,資料庫編號達到對應關係。

4、還是根據主鍵來判斷在哪個庫,策略是給每個主鍵取乙個值範圍段,id主鍵為數字型,比如:a庫的主鍵範圍是1-10000,b庫的主鍵是20000-30000等。

5、採用的對映關係,針對每一條記錄都會對應乙個分割槽,在資料庫中有專門的分割槽維護表來維護這種對應關係,優點是可以方便的實現資料遷移。

附:這個方案的不足之處是沒有進行分布式資料庫的事務處理,也沒有明確說明這個方案的效率到底是如何。

分布式 資料訪問層

所有的業務資料都放在乙個資料庫中來管理 資料庫減壓是思路有三個 資料庫拆分可以水平拆分或者垂直拆分 垂直拆分是把乙個資料庫中不同業務單元的資料分到不同的資料庫裡 帶來的影響 水平拆分是根據一定的規則把同一業務單元的資料拆分到多個資料庫中 帶來的影響 1.了解分布式事務 分布式事務是指事務的參與者,支...

saiku 分布式實踐

saiku比較吃記憶體,一旦人多了,那麼記憶體可能不夠,所以會考慮主從結構,分擔壓力。為了保證資料的穩定性,也會有類似的考慮,那麼問題來了,如何實現saiku的分布式搭建哪?首先saiku使用的jackrabbit儲存的元資料結構,而他使用repository資料夾儲存資料,所以分布式必然要共享資料...

TensorFlow分布式實踐

大資料時代,基於單機的建模很難滿足企業不斷增長的資料量級的需求,開發者需要使用分布式的開發方式,在集群上進行建模。而單機和分布式的開發 有一定的區別,本文就將為開發者們介紹,基於tensorflow進行分布式開發的兩種方式,幫助開發者在實踐的過程中,更好地選擇模組的開發方向。分布式開發會涉及到更新梯...