資料倉儲理論兩大流派(摘)

2021-06-20 00:12:20 字數 1504 閱讀 6550

ralph大師的kimball:

bill 大師的inmon

1.簡要介紹

bi系統的架構設計,以資料倉儲架構設計為其核心。資料倉儲的架構領域在理論知識上

存在著兩大流派,它們分別是由兩位大師ralph kimball&bill inmon,在上世紀 

90年代初提出。這兩位大師均是商業智慧型/資料倉儲領域的泰斗宗師級人物、理論家, 

但是他們兩位的理念和思路有較大差異。他們的跟隨者之間也經常有關於哪種架構和建設

方式更優的辯論。

在國內,我們通常所說的資料倉儲的四個特性角度的定義(面向主題、整合、相對穩定、 

反映歷史變化,用於支援決策),就是inmon提出來的,他也被稱為資料倉儲之父。

而實踐大師kimball他的的工具箱系列著作,亦被奉為資料倉儲建設的經典書籍。

2.資料倉儲架構特點

kimball支援資料倉儲匯流排結構,提倡維度建模,以

星形模型或是雪花模型等方式構建維度資料倉儲,它的架構體系中,資料集市與維度資料

倉庫是緊密結合的,資料集市是資料倉儲中乙個邏輯上的主題域。各種前端工具將可以直

接訪問使用維度資料倉儲。

inmon提倡以三正規化構建集中式的企業資料倉儲(edw),作為 

整個系統核心,在其之上再建設若干面向主題的、遵循維度模型設計的資料集市。在此體 

系中,前端工具通常訪問資料集市,而不直接訪問edw。 3.

建設方式特點

kimball建議從底向上。先建設滿足部門級分析需求的若干資料集市,再通過匯流排架構將

它們整合,形成乙個"聯合資料倉儲"。它的這個方法常被稱為自底向上方式。

inmon強調自項向下。先將來自各源業務系統資料整合至企業級的資料倉儲,再基於其搭

建面向部門應用需求的資料集市。

4.各自的適用場景,如何選擇

。出發點        kimball                                        inmon

規劃層級    戰術                                            戰略

資料整合    滿足部分指定需求即可                企業級範圍資料整合

技術相關    可小型團隊,技能要求一般         需大型團隊,技能要求高

時間約束    有迫切的需求                              允許長週期建設

建設成本    較低成本實現                              高成本

kimball方法對團隊技術水平要求不太高,更易於實現,從小型的主題域資料

集市建設起,但在逐步建設過程中,聯合維度資料倉儲的一致性較難控制,適用於技術層

級的規劃,或是有迫切的目標需要實現。

inmon的方式,規範性較好,資料集市和資料一致性方面能得到處理,適於較為大型的

企業級、戰略級的規劃,但對團隊的要求較高,且實現週期較長、成本高昂。

具體可根據企業的規模、專案規劃、預算、團隊等角度進行綜合考慮。

資料倉儲理論

資料倉儲的概念原先為 商業資料倉儲 本質上,資料倉儲是一種從操作性系統到決策支援環境的資料流架構模型,而數倉概念也是為了解決和這個資料流相關的各種問題,主要是解決多重資料複製帶來的高成本問題。在沒有資料倉儲的時代,需要大量的冗餘資料來支撐多個決策支援環境。inmon將資料倉儲描述為乙個面向主題的 整...

資料倉儲分層理論

cif 層次架構 資訊工廠 通過分層將不同的建模方案引入到不同的層次中,cif 將資料倉儲分為四層,如下圖所示 ods operational data store 運算元據儲存層,往往是業務資料庫 的一對一對映,將業務資料庫中的 在 ods重新建立,資料完全一致。dwd data warehous...

資料倉儲的理論01

維度建模是以分析決策的需求出發構建模型 為分析需求服務,解決了使用者如何快速完成分析需求 分析型資料庫 資料集市 資料倉儲的建模方法 面向分析,以查詢為主,不涉及資料更新操作 事實表設計的概念 能夠正確的記錄歷史資訊為準則 維度表 設計 合適的角度聚合主題的內容為準則 維度建模的方式有哪些 星形模式...