資料倉儲分層架構

在一篇部落格看見了有關資料倉儲分層的內容，概括如下：

複製層（ssa,system-of-records-staging-area）

ssa 直接複製源系統的資料，盡量保持業務資料的原貌；與源系統資料唯一不同的是，ssa 中的資料在源系統資料的基礎上加入了時間戳的資訊，形成了多個版本的歷史資料資訊。

原子層（sor,system-of-record）

sor 是基於模型開發的一套符合 3nf 正規化規則的表結構，它儲存了資料倉儲內最細層次的資料，並按照不同的主題域對資料分類儲存；比如高校資料統計服務平台根據目前部分需求將全校資料在 sor 層中按人事、學生、教學、科研四大主題儲存；sor 是整個資料倉儲的核心和基礎，在設計過程中應具有足夠的靈活性，以能應對新增更多的資料來源、支援更多的分析需求，同時能夠支援進一步的公升級和更新.

3 .彙總層（sma,summary-area）

sma 是 sor和dm（集市層）的中間過渡，由於 sor 是高度規範化資料，此要完成乙個查詢需要大量的關聯工作，同時dm 中的資料粒度往往要比 sor 高很多，對要生dm 中的彙總資料需要進行大量的彙總工作，此，sma 根據需求把 sor 資料進行適度的反範(例如，設計寬表結構將人員資訊、幹部資訊等多表的資料合併起來）和彙總（例如，一些常用的頭彙總、機構彙總等）；從而提高資料倉儲查詢效能。

根據以上資料，介紹下我們所做的資料倉儲的分層。

數倉一（sas+lsf+oracle）：

landing 該層表都帶有land，主要是通過sas將檔案載入到該層，沒有對原始檔進行過處理。但是新增了時間戳字段，比如載入檔案的日期和原始檔資料的日期。

staging層表在land表基礎上進行了簡單的處理，一般乙個land表對應乙個stg表。

ods層

資料倉儲分層架構

資料倉儲架構分層

資料倉儲分層架構設計

資料倉儲分層架構設計

資料倉儲分層架構

資料倉儲架構分層

資料倉儲分層架構設計

資料倉儲分層架構設計

相關推薦