資料倉儲維度建模步驟

2021-09-25 09:35:38 字數 2125 閱讀 1127

在商業智慧型專案的實施過程中,維度建模技術和企業資料倉儲建模是兩種不同的方**,以下是以應用驅動、提供快速原型的商業智慧型專案的實施和規劃過程中使用的維度建模方法時的標準實施過程。具體到專案中則根據專案的規模及所涉及的業務範圍而有所補充或裁減。

1. 商業智慧型專案規劃

a) 資料倉儲專案的定義及範圍

b) 專案準備評估

c) 業務合理性證明

2. 商業智慧型專案業務需求定義

a) 業務需求收集

b) 業務需求審查

c) 資料審計

3. 資料倉儲邏輯設計

3.1. 維度建模

維度建模是一種邏輯設計技術,該技術試圖採用某種直觀的標準框架結構來表現資料並且允許高效能訪問

優點:a) 維度建模是可**的標準框架。允許資料庫系統和終端使用者查詢工具在資料方面生成強大的假設條件,這些資料主要在表現和效能方面起作用。

b) 星型連線模式的可**框架能夠忍受不可預知的使用者行為變化。

c)具有非常好的可擴充套件性,以便容納不可預知的新資料來源和新的設計決策。可以很方便在不改變模型粒度情況下,增加新的分析維度和事實,不需要過載資料,也不需要為了適應新的改變而重新編碼。較好的擴充套件性意味著以前的所有應用都可以繼續執行,並不會產生不同的結果。

3.2. 定義資料倉儲匯流排結構

a)業務驅動維度建模

b) 資料倉儲匯流排結構矩陣

c) 一致性維度

d) 一致性事實

一致性維度和一致性事實是資料倉儲的「匯流排」

e) 單元資料集市

購貨訂單,裝船,付款等,**於單個事務

f) 多元資料集市

客戶利潤率,其中描述收益的傳統源必須與描述成本的傳統源組合在一起使用。**於多個事務,應該從單元資料集市開始建立資料集市。

g) 事務模式資料集市

h) 週期快照資料集市

i) 累計快照資料集市

3.3. 定義高階資料模型邏輯圖

3.4.維度模型的設計過程

a) 選取業務處理

b) 定義粒度

c) 選定維度

d) 確定事實

3.5. 源資料-目標資料對映

即etl規則定義,設計資料倉儲與資料來源之間的邏輯對映與轉換關係。

a) 維度表對映

b) 事實表對映

3.6. 產出文件

a) 資料倉儲匯流排結構文件

b) 高階資料模型文件

c) 資料模型及etl設計文件

4. 資料倉儲物理設計

4.1. 建立物理資料模型

a) 選擇資料建模工具

b) 物理資料結構的設計

4.2. 制定最初的索引計畫

a) 為事實表建立索引

b) 為維度表建立索引

4.3. 設計和建立資料庫例項

a) 儲存資料庫建立指令碼和引數檔案

b) 建立物理儲存結構

4.4. 資料倉儲物理設計產出文件

5. etl設計與開發

5.1. 維度表裝載設計

5.2. 事實表裝載設計

5.3. 聚合表和多維聯機分析處理裝載

5.4. 資料倉儲的操作與自動化

資料倉儲操作都是在非公開方式下定期執行裝載處理。

5.5. 產出文件

a) 專案開發文件

b) 在資料模型及etl設計文件中加入相關部分的設計內容

6. 多維資料集開發

6.1. 資料集市定義

a) 維度定義

b) 度量值組定義

c) 計算成員定義

6.2. 資料透視定義

根據使用者應用需求將多個度量值組組合在一起,定義出乙個多維資料集的子集。

6.3. 產出文件

a) olap 多維資料集專案開發文件

b) olap 多維資料集業務說明文件

資料倉儲維度建模

雪花模型 星型模型 星座 多個事實表 問題 1 資料倉儲,不針對某乙個分析主題,而是有多個分析主題,即多個事實表,維度表怎麼設計?2 即使是同乙個分析主題,也可能存在多個事實表,維度表如何設計?多個時間維度?無論星型模型 雪花模型還是星座模型,都是針對維度上的區別而來,星座模型實質上還是星型模型,只...

資料倉儲維度建模概述

面向主題的。操作型資料庫的資料組織面向事物處理任務,各個業務系統之間各自分離,而資料倉儲中的資料是按照一定的主題域進行組織的。例如 當事人 協議 機構 財務 事件 產品等主題。整合的。資料倉儲中的資料是從多個不同的資料來源傳送來的。多個應用之間在編碼,命名習慣,物理屬性 不同的資料庫 欄位的資料型別...

資料倉儲之維度建模

1.資料倉儲建模目標 資料倉儲建模的目標是通過建模的方法更好的組織 儲存資料,以便在效能 成本 效率和資料質量之間找到最佳平衡點。訪問效能 能夠快速查詢所需的資料,減少資料 i o 資料成本 減少不必要的資料冗餘,實現計算結果資料復用,降低大資料系統中的資料 成本和計算成本 使用效率 改善使用者應用...