數倉維度建模之維度表設計(基礎概念一)

2021-10-04 02:25:46 字數 1176 閱讀 7339

對業務過程的度量稱為事實

在維度建模中,將度量稱為「事實」,將環境描述為「維度」,維度是用於分析事實所需要的多樣環境

維度所包含的表示維度的列,稱為維度屬性 如開門方式是維度,具體11種方式是維度屬性

維度屬性是查詢約束條件、分組和的基本**,是資料包表標籤生成易用性的關鍵。

維度的作用一般是查詢約束、分類彙總以及排序、生成報表標籤等。

維度使用主鍵標識其唯一性

在和業務人員的交談中發現維度或維度屬性。常出現在查詢或報表請求中的「按照」(by)語句內

在報表中獲取

用來描述其業務的自然修飾詞應作為維度或維度屬性包括在維度模型中。

用於標識某維度的具體值;

是確保與之相連的任何事實表之間存在引用完整性的基礎。

主鍵有兩種:**鍵和自然鍵

**鍵是不具有業務含義的鍵,如自增主鍵, 一般用於處理緩慢變化維;

自然鍵是具有業務含義的鍵。如商品id

闡述:將一些常用的維度屬性直接寫到事實表中的維度操作稱為維度退化

維度中的一些描述屬性以層次方式或一對多的方式相互關聯,可以

被理解為包含連續主從關係的屬性層次。層次的最底層代表維度中描述

最低級別的詳細資訊,最高層代表最高端別的概要資訊。維度常常有多

個這樣的嵌入式層次結構。

比如**商品維度,有賣家、類目、品牌等。

商品屬於類目,類目屬於行業,其中類目的最低級別是葉子類目,葉子類目屬於二級類目,二級類目屬於一級類目。

1)定義

下鑽是商業使用者分析資料的最基本的方法。下鑽僅需要在查詢上增加乙個維度屬性,附加在sql的group by語句中。屬性可以來自任何與查詢使用的事實表關聯的維度。下鑽不需要存在層次的定義或是下鑽路徑。

2)示例

層次型下鑽:年-》月-》日-》時 逐層下鑽

非層次型下鑽:

跨表鑽取:多表通過公共維度屬性聯合鑽取。又稱編織、多遍查詢。

按照三正規化形成設計是事實和緯度表的方式管理資料稱為規範化

規範化常用於oltp系統的設計

將維度的屬性層次合併到單個維度中的操作稱為反規範化

反規範化會產生包含全部資訊的寬表,形成資料冗餘;實現用維表的空間換取簡明性和查詢效能的效果,常用於olap系統的設計

數倉 正規化建模 維度建模

third normal form,3nf 是資料模型常用的乙個方法,主要解決關係型資料庫的資料儲存。目前關係型資料庫的建模方法,大部分採用三正規化建模,即通過實體關係 entity relationship,er 模型描述企業業務。是資料倉儲之父inmon提出的集線器的自上而下 edw dm 的資...

數倉 維度建模與緩慢變化維

維度表示你要對資料進行分析時所用的乙個量,比如你要分析產品銷售情況,你可以選擇按類別來進行分析,或按區域來分析.這樣的按.分析就構成乙個維度。前面的示例就可以有兩個維度 型別和區域。另外每個維度還可以有子維度 稱為屬性 例如類別可以有子型別,產品名等屬性。下面是兩個常見的維度表結構 產品維度表 pr...

數倉分層和維度建模及表的簡述

1.ods層 原始資料層,存放原始資料,直接載入原始日誌 資料,資料保持原貌不做處理,起到備份資料的作用。資料採用lzo壓縮,並建立索引減少磁碟儲存空間 切片 建立分割槽表,防止後續全表掃瞄。可以通過建立外部表供多人使用,內部表 僅供自己使用 2.dwd層 明細資料層,對ods層資料進行清洗 去空值...