數倉維度模型

2022-06-07 03:36:09 字數 606 閱讀 7961

一、scd(slowly changing dimensions),中文一般翻譯成「緩慢變化維」。

顧名思義,緩慢變化維度(slowly changing dimension, scd)就是資料倉儲維度表中,那些隨時間變化比較不明顯,但仍然會發生變化的維度。考慮以下兩個情境:

處理緩慢變化維度是kimball數倉體系中永恆的話題,因為資料倉儲的本質,以及維度表在維度建模中的基礎作用,我們幾乎總是要跟蹤維度的變更(change tracking),以保留歷史,並提供準確的查詢和分析結果。在《the data warehouse toolkit, 3rd edition》一書的第5章,kimball提出了多種緩慢變化維度的型別和處理方法,其中前五種是原生的,後面的方法都是混合方法(hybrid techniques),因此下面來看看前五種,即type 0~type 4。

二、退化維度

本篇討論一種稱為退化維度的技術。該技術減少維度的數量,簡化維度資料倉儲的模式。簡單的模式比複雜的更容易理解,也有更好的查詢效能。當乙個維度沒有資料倉儲需要的任何資料時就可以退化此維度。需要把退化維度的相關資料遷移到事實表中,然後刪除退化的維度。

二、雜項維度

如果每個屬性值都很少,可以把這些維度的組合起來生成乙個維度表。

數倉 正規化建模 維度建模

third normal form,3nf 是資料模型常用的乙個方法,主要解決關係型資料庫的資料儲存。目前關係型資料庫的建模方法,大部分採用三正規化建模,即通過實體關係 entity relationship,er 模型描述企業業務。是資料倉儲之父inmon提出的集線器的自上而下 edw dm 的資...

數倉建設中最常用模型 Kimball維度建模詳解

先來介紹下此書,此書是基於作者 60 多年的實際業務環境而總結的經驗及教訓,為讀者提供正式的維度設計和開發技術。面向數倉和bi設計人員,書中涉及到的內容非常廣泛,圍繞一系列的商業場景或案例研究進行組織。強烈建議買一本實體書研究,反覆通讀全書至少三遍以上,你的技術將會有質的飛躍。因為本文是純理論知識,...

數倉維度建模之維度表設計(基礎概念一)

對業務過程的度量稱為事實 在維度建模中,將度量稱為 事實 將環境描述為 維度 維度是用於分析事實所需要的多樣環境 維度所包含的表示維度的列,稱為維度屬性 如開門方式是維度,具體11種方式是維度屬性 維度屬性是查詢約束條件 分組和的基本 是資料包表標籤生成易用性的關鍵。維度的作用一般是查詢約束 分類彙...