資料倉儲中的幾種資料模型

2021-09-02 18:16:29 字數 1131 閱讀 9359

資料倉儲中常見的模型有:正規化建模,雪花模型,星型建模,事實星座模型.

星型模型

星型模型是資料集市維度建模中推薦的建模方法。星型模型是以事實表為中心,所有的維度表直接連線在事實表上,像星星一樣。星型模型的特點是資料組織直觀,執行效率高。因為在資料集市的建設過程中,資料經過了預處理,比如按照維度進行了彙總,排序等等,資料量減少,執行的效率就比較高。

雪花模型

雪花模型也是維度建模中的一種選擇。雪花模型的維度表可以擁有其他維度表的,雖然這種模型相比星型模型更規範一些,但是由於這種模型不太容易理解,維護成本比較高,而且效能方面需要關聯多層維表,效能也比星型模型要低。所以一般不是很常用。

正規化建模

第三正規化建模是在資料庫建模中使用的建模方法,特點是體系化,擴充套件性好,避免冗餘,避免更新異常。所以,在資料倉儲的edw層建模中,我們也提倡使用第三正規化建模。但是資料倉儲的整合和反映歷史變化的特徵意味著資料量非常之大,表和表之間的關聯效率比較低,所以有些時候完全規範的正規化建模並不是最好的選擇,通常我們會選擇非規範化處理,增加一些冗餘的字段來避免表之間關聯的次數,這樣會節約大量的時間。

雪花模型是介於星型模型和正規化建模之間的。個人理解,正規化建模和雪花模型的區別在於雪花模型在維度上也是有冗餘的。例如雪花模型例圖的地域維度不符合第三正規化,因為地域維度中存在傳遞依賴,城市-省級-國家-地域。

星座模型

星座模型是星型模型延伸而來,星型模型是基於一張事實表的,而星座模型是基於多張事實表的,而且共享維度資訊。 通過構建一致性維度,來建設星座模型,也是很好的選擇。比如同一主題的細節表和彙總表共享維度,不同主題的事實表,可以通過在維度上互相補充來生成可以共享的維度。

資料倉儲 資料模型

資料模型是抽象描述現實世界的一種工具和方法,是通過抽象的實體及實體之間聯絡的形式,來表示現實世界中事務的相互關係的一種對映。在這裡,資料模型表現的抽象的是實體和實體之間的關係,通過對實體和實體之間關係的定義和描述,來表達實際的業務中具體的業務關係。資料倉儲模型是資料模型中針對特定的資料倉儲應用系統的...

資料倉儲 邏輯資料模型

在資料倉儲領域有乙個概念叫logical data model,中文一般翻譯為 邏輯資料模型 邏輯資料模型設計與概念資料模型設計 物理資料模型設計是資料庫及資料倉儲模型設計的三個主要步驟。邏輯資料模型反映的是系統分析設計人員對資料儲存的觀點,是對概念資料模型進一步的分解和細化。邏輯資料模型是根據業務...

資料倉儲之資料模型

關於資料倉儲的概念,這裡不再累贅。先看下面的圖 資料倉儲建設的7個主要環節 本文,主要針對第三塊資料倉儲模型設計來討論交流,尤其是網際網路行業。一 關於資料倉儲資料模型 1.資料倉儲資料模型是指使用實體 屬性及其關係對企業運營和邏輯規則進行統一的定義 編碼和命名 是業務人員和開發人員之間溝通的一套語...