維度建模步驟

2022-05-08 19:21:08 字數 3048 閱讀 7408

2023年05月15日 10:50:00

資料模型是指用實體、屬性、實體之間的關係對業務概念和邏輯規則進行統一的定義,命名和編碼,主要描述企業的資訊需求和業務規則,是業務人員和開發人員溝通的語言,是資料倉儲架構設計工作開始的第一步。正確的資料模型是使用者需求的集中體現,是商業智慧型專案成功與否最重要的因素之一。資料模型可以分為概念模型、邏輯模型、物理模型,本節進行詳細的介紹。

3.6.1  概念模型

從定義上來說,概念模型是最高層次的資料模型,反映了資料倉儲的主要主題和重要業務之間的關係。一般來說,在進行資料倉儲系統設計和開發之前,設計開發人員和業務人員已經對概念模型達成了共識,因為概念模型反映的是核心的業務問題。

概念模型的設計步驟如下:

1)從業務需求中提取重要的業務資料主題,包括對業務資料主題的詳細解釋,見表3-1。

表3-1  資料主題及其解釋

2)在業務資料主題的基礎上進行資料主題域的劃分,包括對資料主題域的詳細解釋,如圖3-15所示。

圖3-15  人員與組織主題域包括的資訊及解釋

a) 人員與組織主題域包括的資訊  b) 對人員與組織主題域的詳細解釋

3)劃分主題域概念模型:根據資料主題域的劃分,細化內部的組織結構和業務關係,如圖3-16所示。

總結:概念模型建模的流程大致可以分成如下幾個部分:通過對業務系統的詳細說明,進行資料的梳理,列出資料主題詳細的清單,並對每個資料主題都作出詳細的解釋,然後經過歸納、分類,整理成各個資料主題域,列出每個資料主題域包含哪些部分,並對每個資料主題域作出詳細解釋,最後劃分成主題域概念模型,如圖3-17所示。

圖3-16  劃分主題域概念模型

圖3-17  概念模型設計流程圖

3.6.2  邏輯模型

從定義上講,邏輯模型是以概念模型為基礎,對概念模型的進一步細化、分解。邏輯模型通過實體和實體之間的關係描述業務的需求和系統實現的技術領域,是業務需求人員和技術人員溝通的橋梁和平台。概念模型和邏輯模型的關係如圖3-18所示。

(1)邏輯模型的設計

邏輯模型的設計是資料倉儲實施中最重要的一步,因為它直接反映了業務部門的實際需求和業務規則,同時對物理模型的設計和實現具有指導作用。它的特點就是通過實體和實體之間的關係勾勒出整個企業的資料藍圖和規劃。邏輯模型一般遵循第三正規化,與概念模型不同,它主要關注細節性的業務規則,同時需要解決每個主題域包含哪些概念範疇和跨主題域的繼承和共享的問題。

圖3-18  概念模型和邏輯模型的關係

(2)邏輯模型設計的一般步驟

概念模型的主題域一般是從企業現有的資訊系統和行業自身業務活動彙總得來的業務模型主題域。而邏輯模型除了在概念模型的基礎上豐富和細化主題域,並且確定每個主題域包含哪些主題外,還需要以下幾個步驟。

1)分析需求,列出需要分析的主題,需求目標、維度指標、維度層次、分析的指標、分析的方法、資料的**、關注的物件等。例如,所要分析的主題是電力營銷業務分析處理情況,見表3-2。

表3-2  電力營銷業務分析處理情況

2)選擇使用者感興趣的資料,通過業務需求將需要分析的指標分離抽取出來,轉化成邏輯模型需要的實體。例如,從使用者數量、用電儲存容量等分析指標中分離出使用者實體和用電量實體。

3)在實體中需要增加時間戳屬性,因為實體中需要儲存各個階段的歷史資料。通常情況下,如果實體為統一編碼,則不需要增加時間戳屬性。

4)需要考慮粒度層次的劃分。資料倉儲的粒度層次劃分直接影響了資料倉儲模型的設計,通常細粒度的資料模型直接從企業模型選取實體作為邏輯模型的實體,而粗粒度的資料模型需要經過彙總計算得到相應的實體。粒度決定了企業資料倉儲的實現方式、效能、靈活性和資料倉儲的資料量。

5)在粒度層次劃分的基礎上,還需要進行關係模式的定義。關係模式一般採取第三正規化的特點進行定義,對當前的主題進行關係模式的劃分,形成各個實體、實體屬性、實體之間的關係等內容。同時在邏輯模型框架的基礎上對實體的中英文名稱、屬性、屬性的值域進行明確、完善和細化,真實反映業務邏輯關係和業務規則。

邏輯模型的設計流程圖如圖3-19所示。

圖3-19  邏輯模型的設計流程圖

3.6.3  物理模型

(1)物理模型設計階段

在邏輯模型的基礎上,為應用生產環境選取乙個合適的物理結構的過程,包括合適的儲存結構和儲存方法,稱作物理模型的設計過程。

邏輯模型轉變為物理模型包括以下幾個步驟:

1)實體名(entity)轉變為表名(table)。

2)屬性名(attribute)轉換為列名(column),確定列的屬性(property)。

(2)實現業務規則

物理模型必須對列的屬性進行明確的定義,包括:列名、資料型別(與特定資料庫管理系統有關)、長度、能否為空值、有效性規則、預設值等,如圖3-20所示。

圖3-20  資料倉儲的物理模型

物理模型確定以後,可以進一步確定資料的存放位置和儲存空間的分配,最後生成定義資料庫的sql命令。

概念模型、邏輯模型和物理模型的區別如圖3-21所示。

圖3-21  概念模型、邏輯模型和物理模型的區別

維度建模步驟

資料模型是指用實體 屬性 實體之間的關係對業務概念和邏輯規則進行統一的定義,命名和編碼,主要描述企業的資訊需求和業務規則,是業務人員和開發人員溝通的語言,是資料倉儲架構設計工作開始的第一步。正確的資料模型是使用者需求的集中體現,是商業智慧型專案成功與否最重要的因素之一。資料模型可以分為概念模型 邏輯...

kimball維度建模步驟

業務需求 維度模型 1.業務處理 2.粒度 3.維度 4.事實 資料實際 首先對業務進行描述,以使建立的維度與事實表更容易理解。在對業務例項研究進行描述之後,現在就可以開始維度建模的設計工作了。設計工作的第一步使,通過將對業務需求的理解與對可用資料的理解組合起來而確定 建模的業務處理內容。建立的第乙...

資料倉儲維度建模步驟

在商業智慧型專案的實施過程中,維度建模技術和企業資料倉儲建模是兩種不同的方 以下是以應用驅動 提供快速原型的商業智慧型專案的實施和規劃過程中使用的維度建模方法時的標準實施過程。具體到專案中則根據專案的規模及所涉及的業務範圍而有所補充或裁減。1.商業智慧型專案規劃 a 資料倉儲專案的定義及範圍 b 專...