資料倉儲之資料模型

2021-09-07 18:57:23 字數 824 閱讀 3746

關於資料倉儲的概念,這裡不再累贅。先看下面的圖(資料倉儲建設的7個主要環節):

本文,主要針對第三塊資料倉儲模型設計來討論交流,尤其是網際網路行業。

2. 資料倉儲資料模型的作用:

3. 資料倉儲資料模型與業務系統資料模型設計的區別:

關係建模又叫er建模,是資料倉儲之父inmon推崇的,其從全企業的高度設計乙個3nf模型的方法,用實體加關係描述的資料模型描述企業業務架構,在正規化理論上符合3nf,其是站在企業角度進行面向主題的抽象,而不是針對某個具體業務流程的,它更多是面向資料的整合和一致性治理,正如inmon所希望達到的「single version of the truth」。

維度模型則是資料倉儲領域另一位大師ralph kimball 所倡導的。維度建模以分析決策的需求為出發點構建模型,一般有較好的大規模複雜查詢的響應效能,更直接面向業務,典型的代表是我們比較熟知的星形模型,以及在一些特殊場景下適用的雪花模型。

兩者的主要區別在於靈活性和效能方面。

另外,關係模型要求資料以最細粒度存在,而多維模型則以輕粒度彙總資料存在。

(記得十年前,某大型保險公司實施edw專案,採用的就是關係模型,由ibm專門的團隊負責建模,好傢伙)。

在我看來,如果不是實施業務相對成熟的edw,大多資料倉儲均會採用維度模型建模;

1. 網際網路資料倉儲的現實狀況

在我們的資料倉儲中,除了各個主題域下的維度模型,還存在一些寬表模型。所謂寬表模型,是基於維度模型的擴充套件,採用退化維度的方式,將不同維度的度量放入資料表的不同的列中;它更易於理解,具有更高的查詢效率;易於模型擴充套件;

事實證明,在海量資料環境下,對業務查詢的支撐,寬表在效能和易用性方面,都達到了比較理想的效果。

資料倉儲之資料模型

關於資料倉儲的概念,這裡不再累贅。先看下面的圖 資料倉儲建設的7個主要環節 本文,主要針對第三塊資料倉儲模型設計來討論交流,尤其是網際網路行業。一 關於資料倉儲資料模型 1.資料倉儲資料模型是指使用實體 屬性及其關係對企業運營和邏輯規則進行統一的定義 編碼和命名 是業務人員和開發人員之間溝通的一套語...

資料倉儲之資料模型

關於資料倉儲的概念,這裡不再累贅。先看下面的圖 資料倉儲建設的7個主要環節 本文,主要針對第三塊資料倉儲模型設計來討論交流,尤其是網際網路行業。2.資料倉儲資料模型的作用 3.資料倉儲資料模型與業務系統資料模型設計的區別 關係建模又叫er建模,是資料倉儲之父inmon推崇的,其從全企業的高度設計乙個...

資料倉儲 資料模型

資料模型是抽象描述現實世界的一種工具和方法,是通過抽象的實體及實體之間聯絡的形式,來表示現實世界中事務的相互關係的一種對映。在這裡,資料模型表現的抽象的是實體和實體之間的關係,通過對實體和實體之間關係的定義和描述,來表達實際的業務中具體的業務關係。資料倉儲模型是資料模型中針對特定的資料倉儲應用系統的...