資料倉儲學習筆記三

2021-08-10 01:20:23 字數 2294 閱讀 1791

太上有立德,其次有立功,其次有立言,雖久不廢,此謂不朽。——《左傳》

簡單解釋:

二者的區別:

維度表的冗餘很大,主要是因為維度一般不大(相對於事實表來說的),而維度表的冗餘可以使事實表節省很多空間。

事實表一般都很大,如果以普通方式查詢的話,得到結果一般發的時間都不是我們可以接受的。所以它一般要進行一些特殊處理。如sql server 2005就會對事實表進行如預生成處理等。

事實表一般是沒有主鍵的,資料的質量完全由業務系統來把握。

資料模型作為一種資料倉儲的設計基礎,在實際應用中還存在許多缺點。考慮圖3 - 5 6所

示的簡單資料模型。

圖 1

圖3 - 5 6中所示的資料模型中有四個相互關聯的簡單實體。如果資料庫設計只需要考慮數

據模型的話,可以推斷所有的實體都是平等關係。換言之,從資料模型的設計角度來看,所

有的實體之間的關係是對等的。僅僅從資料模型的角度來著手設計資料倉儲會產生一種「平

面」效應。實際上,由於種種原因,資料倉儲的實體絕不會是相互對等的。一些實體,要求

有它們自己的特別處理。為了明確為什麼從資料模型的角度看乙個組織中的資料和關係會發

生失真,根據在資料倉儲中建立實體時將載入資料實體的資料量,我們來考慮資料倉儲中數

據的一種三維透視。圖3 - 5 7表明了這種三維透視。代表**商、客戶、產品、發貨的實體被

稀疏地載入,而代表訂單的實體則大量地載入。將會有大量的資料載入代表訂單實體的表中,

而在代表別的實體的表中載入的資料量則相對較少。由於大量的資料要載入訂單實體,因此

需要一種不同的設計處理方式。

圖2

用來管理資料倉儲中載入某個實體的大量資料的設計結構被稱為「星型連線」。圖3 - 5 8給

出星型連線的乙個簡單例子。「訂單」位於星型連線的**。它是被大量載入資料的實體。在

其周圍分別是「產品」、「客戶」、「**商」和「發貨」實體。這些實體僅僅會產生不大的數

據量。星型連線**的「訂單」被稱作是「事實表」,而其周圍的其他實體—「產品」、「客

戶」、「**商」和「發貨」則被稱為「維表」。事實表包含了「訂單」獨有的標識資料,也包

含了訂單本身的獨有資料。事實表還包含了指向其周圍的表—維表的外來鍵。如果非外來鍵的

資訊經常被事實表使用,那麼星型連線內的非外來鍵資訊將會伴隨外來鍵的關係共同存在。例如,

如果「產品」的描述將被「訂單」處理過程經常用到的話,那麼這個描述將會與產品號一起

儲存在事實表中。

圖3

可以有任意多個外來鍵與維表相關。當有必要檢查外來鍵資料與事實表中的資料時,就建立

乙個外來鍵關係。

建立和使用星型連線的乙個有趣的方面是,在很多情況下,文字資料與數值資料是分離

開的。考慮圖3 - 5 9所示的圖表。文字資料常出現在維表中,數值資料常出現在事實表中,這

種劃分似乎在所有情況都會發生。

建立和使用星型連線的好處是可以為決策支援系統的處理優化資料。通過資料預連線和建立

有選擇的資料冗餘,設計者為訪問和分析過程大大簡化了資料,這正是資料倉儲所需要的。應該

注意,如果不是在決策支援系統資料倉儲環境中使用星型連線,則會有很多的缺點。在決策支援

系統資料倉儲環境以外,常有資料更新,而且資料關係的管理要在秒的一級上進行。在這種情況

下星型連線在建立和維護上就是很麻煩的資料結構。但是由於資料倉儲是乙個裝載—訪問環境,

它包括很多歷史資料,且有大量的資料要管理,因此,星型連線的資料結構是十分理想的。

圖4

圖5

是不是星型連線結構的存在意味著資料模型不是設計資料倉儲的基礎了呢?完全不是!

資料模型對於大多數資料倉儲環境的設計來講,仍然是非常有用的一種結構。然而,星型連

接有它本身的恰當位置。圖3 - 6 0說明了資料倉儲決策支援系統的設計中星型連線和資料模型

是怎樣配合起來使用的。星型連線應用於設計資料倉儲中很大的實體,而資料模型則應用於

資料倉儲中較小的實體。

資料倉儲學習筆記一

資料倉儲是乙個面向主題的 整合的 非易失的且隨時間變化的資料集合,用來支援管 理人員的決策。1 主題 圖1傳統的操作型系統是圍繞公司的應用進行組織的。對乙個保險公司來說,應用問題可能 是汽車保險 健康保險 人壽保險與意外 保險。公司的主要主題範圍可能是顧客 保險 單 保險費與索賠。2 整合 圖2 資...

資料倉儲學習筆記(一)

決策支援系統的發展 決策支援系統 decision support system 簡稱dss 可以為決策者提供分析問題 建立模型 模擬決策過程和方案的環境,呼叫各種資訊資源和分析工具,幫助決策者提高決策水平和質量,它是管理資訊系統 mis 向更高一級發展而產生的先進資訊管理系統。資料倉儲技術就是為更...

資料倉儲 筆記

面向主題 整合相對穩定 反映歷史變化 抽取轉換 載入收集和分析業務需求 建立資料模型和資料倉儲的物理設計 定義資料源 選擇資料倉儲技術和平台 從操作型資料庫中抽取,清洗及轉換資料到資料倉儲 選擇訪問和報表工具,選擇資料庫連線軟體,選擇資料分析和資料展示軟體 更新資料倉儲 主題摘要 資訊摘要 綱目摘要...