Data Vault初探(一) 基礎

2021-07-08 17:22:03 字數 697 閱讀 8442

摘自:《pentaho kettle 解決方案: 使用pdi構建開源etl解決方案》

data vault(dv)模型是用於企業級的資料倉儲建模。由dan linstedt在20世紀90年代提出(在最近幾年,data vault模型獲得了很多關注,並在bi社群裡擁有了一批追隨者。

dan linstedt將data vault模型定義如下:

data vault是面向細節的,可追蹤歷史的,它是一組有連線關係的規範化的表的集合。這些表可以支援乙個或多個業務功能,它是一種綜合了第三正規化(3nf)和星型模型優點的建模方法。其設計理念是要滿足企業對靈活性、可擴充套件性、一致性和對需求的適應性要求,它是一種專為企業級資料倉儲量身定製的建模方式。

從上面的定義,可以看出data vault既是一種資料建模的方**,又是構建企業資料倉儲的一種具體方法。data vault模型由三個模組組成,中心表、鏈結表、附屬表。建模方**裡定義了data vault的組成部分和組成部分之間的互動方式。data vault的建模方法中還包括了最佳實踐,來指導構建企業資料倉儲。例如,業務規則應該在資料的下游實現,就是說data vault只按照業務資料的原樣儲存資料,不做任何解釋、過濾、清洗、轉換。即使從不同資料來源來的資料是自行矛盾的(例如同乙個客戶有不同的位址),data vault模型不會遵照任何業務的規則,如「系統a的位址為準」。data vault模型會儲存兩個不同版本的資料,對資料的解釋將推遲到整個架構的後乙個階段(資料集市)。

JS基礎 初探陣列

html view plain copy html head meta charset utf 8 title js基礎 初探陣列 title script 陣列 var arr 1,2 3 小四 伍子胥 alert arr.length 陣列長度 alert arr 3 陣列的第三個元素 小四,預...

初探Redis 基礎篇

作為向web而生的redis,現已經使用得十分廣泛了。依靠其高效能 簡潔設計等深受開發者們喜歡。對redis從基礎學起,抱著知其然到知其所以然的想法,先學會怎麼用,再去深入了解內部運轉。redis官網 redis英文全稱為remote dictionary server,採用c語言開發的開源,基於記...

tp6初探基礎

通過命令列安裝 composer create project topthink think tp命令列安裝的tp6會在根目錄下生成 example.env檔案 此為環境變數示例檔案 重新命名為 env按需求修改即可,修改後預設開啟了除錯模式 檢視.env檔案,設定除錯模式開關 true 開啟除錯時...