資料倉儲實踐雜談(十四) 資料模型參考

2021-10-02 21:53:06 字數 1344 閱讀 7770

[目錄]

眾所周知,資訊系統最重要的作用就是處理並儲存資訊,尤其在商業應用中。以銀行記賬為例,最重要的是賬本,不管前面的流程如何,只要記下來張三某年某月存入100元,業務就算完成了。當然,不是說業務流程的實現不重要,更便捷的流程,能提高業務效率。但核心的部分,是先要把事情做正確。

簡單的定義,資料模型就是類似賬本一樣,能準確反映業務內涵的一組**。由於業務的複雜性,讓一般設計人員在剛開始設計資料模型的時候會無從下手。因此,各大公司都有一些邏輯資料模型的指導,如ncr、ibm等公司。

在金融業務中,由於業務複雜,往往需要大量的**來描述業務,因此,必須分成若干的層次,若干的大模組,自頂向下的逐步細化分析。一般來說,資料模型都會分成三層。第一層是主題域,一般會分成八到十幾個主題域。隨著業務的不斷發展以及對業務的不斷理解加深,主題域有可能增加,也有可能合併。所謂的主題域,是一組描述同一主題的表的集合,如團體、資產等。在某些行業,需要對某些主題(業務範圍)描述的非常完善和充分,這個主題可以作為乙個主題域。但對於某些主題,由於不是業務重點,則可以合併成為乙個主題域。第二層是重要實體,在這個層次,根據主題域的劃分,每個主題域中可以提煉重要的實體。第三層是完整的e-r模型,包含了所有的實體和關係。

目前各公司提出的資料模型的幾大主題域,都是經過特定行業不斷檢驗的最佳實踐。在設計我們自己的資料模型的時候,可以參考這些主題域,使得設計更加完善。

如果針對金融業務較多的話,有些模型提示我們可以把金融交易,財務等作為乙個單獨的主題域來考慮。

另外,如果考慮的統計分類等更為靈活的設計的時候,可以把各種分類方案作為乙個單獨的主題域,被各種實體所引用。如ibm的模型中的「分類」。這是一種技術上的靈活處理,是由於隨著業務的不斷發展,會需要動態的增加新的類別。採用這樣的設計,可以在業務發展的時候,不斷增加模型的資料,而不破壞模型的結構。但這樣的做法帶來的問題的乙個問題是,會導致從模型的結構上,難以全面的反應業務本身。因為很多分類往往代表了業務劃分。這樣做,把業務的結構變成了模型中的資料。從各種模型的主題域劃分的方式上來看,ibm的模型更加具有技術性。更像元元資料模型。

如何取捨,要看具體的設計。

各種模型的主題域,參見下面。

未完待續。

資料倉儲 資料模型

資料模型是抽象描述現實世界的一種工具和方法,是通過抽象的實體及實體之間聯絡的形式,來表示現實世界中事務的相互關係的一種對映。在這裡,資料模型表現的抽象的是實體和實體之間的關係,通過對實體和實體之間關係的定義和描述,來表達實際的業務中具體的業務關係。資料倉儲模型是資料模型中針對特定的資料倉儲應用系統的...

資料倉儲 邏輯資料模型

在資料倉儲領域有乙個概念叫logical data model,中文一般翻譯為 邏輯資料模型 邏輯資料模型設計與概念資料模型設計 物理資料模型設計是資料庫及資料倉儲模型設計的三個主要步驟。邏輯資料模型反映的是系統分析設計人員對資料儲存的觀點,是對概念資料模型進一步的分解和細化。邏輯資料模型是根據業務...

資料倉儲之資料模型

關於資料倉儲的概念,這裡不再累贅。先看下面的圖 資料倉儲建設的7個主要環節 本文,主要針對第三塊資料倉儲模型設計來討論交流,尤其是網際網路行業。一 關於資料倉儲資料模型 1.資料倉儲資料模型是指使用實體 屬性及其關係對企業運營和邏輯規則進行統一的定義 編碼和命名 是業務人員和開發人員之間溝通的一套語...