什麼是資料倉儲

2021-08-31 06:00:13 字數 1665 閱讀 1302

[color=blue]問:資料倉儲有什麼特別的地方?

答:沒什麼特別,跟普通關聯式資料庫沒什麼兩樣.

問:啊,那有什麼特別?

答:資料倉儲本身物理上也是關聯式資料庫,只是資料倉儲系統是乙個體系,乙個過程.資料倉儲技術要解決的問題是如何建立,管理,維護執行乙個資料倉儲.

問:資料倉儲跟普通資料庫儲存的資料不一樣?

答:資料倉儲面向分析,普通業務資料庫面向交易,我們公司產品就是業務資料庫.面向分析的資料庫重點在查詢,業務資料庫重點在修改更新.

問:資料倉儲就是把業務資料庫的資料抽出來建立新的資料庫,專門供分析查詢用?

答:可以這麼說,不過不是簡單的抽取,因為兩者的應用不同,所依賴的資料模型不同,資料倉儲主要採用多維模型,而業務資料庫採用關係模型。所以,抽取的過程是一次模型的轉換,從關係模型轉換為多維模型,這個過程業界成為etl,除了轉換外,還要考慮資料整合,清洗等。

問:可是你不是說資料倉儲物理上也是關係模型,怎麼表示多維模型?

答:業界用稱為星型結構的多個表來表示多維模型,多個維表圍繞在事實表轉,其中事實表表示資料,維表表示維度。多維模型也成cube,立方體,邊是維度,格仔是發生資料。

問:那olap是什麼,資料倉儲不就是olap嗎?

答:olap是聯機分析處理的意思,olap是一本技術,它的產品分為伺服器和前端產品,olap伺服器也叫做多維資料庫,資料倉儲跟olap的關係,就像父親和孩子的關係,廣義的資料倉儲包含olap,有些產商把兩者混起來。但是,實際上資料倉儲可以脫離olap存在,不供olap使用。這個比較複雜,很難一下說清楚。

問: 再說說嘛。

答: 其實,olap技術是資料倉儲的一種應用,olap一般基於資料倉儲,也就是說,olap伺服器中的多維資料,也是從資料倉儲中來的。olap一般位為資料倉儲之上,olap的作用是為前端報表或控制項提供直觀的易於分析的多維資料,是資料與資訊之間的一種橋梁。

問: olap還是挺神奇的,它到底能幹什麼?

答: olap技術其實定義了一些邏輯模型,包括結構模型和行為模型,結構模型即維度、cube模型,把現實的資料以多維的形式來表達,有利於分析。為什麼有利於分析呢,行為模型就是定義在結構模型之上的分析行為,包括維度自由組合、旋轉、鑽取等等,而這些行為是比較直觀的,符合人腦的思維習慣。

問: 等等,鑽取是什麼,好像很熟,是資料探勘嗎?

答: 暈,資料探勘跟這不搭邊的,等下再說。鑽取是從高粒度的資料鑽到低粒度的資料中,比如從廣東省的彙總資料鑽到各個城市的資料。這在以前的報表工具中是很難實現的。

問: 怎麼做到鑽取?

答: 其實,維度不是線性的,而是一顆樹,術語叫「帶有層級關係的維度」,這個層級關係就定義了父子關係,鑽取路徑。

問: 哦,還是暈,那我們自己的olap工具在做什麼。

答: 我們自己的olap工具有別於國外產商,我們沒有儲存,也就是沒有olap伺服器的概念。我們有olap前端和olap服務引擎,服務引擎直接從業務資料庫或者資料倉儲中抽取資料生成cube模型的資料,olap前端元件比如**和圖形,將cube模型的資料表現出來,並提供分析功能。也就是說,我們的olap定義了一套olap模型,就是上面說的結構模型和行為模型,服務引擎負責把關係模型的資料轉換為多維模型,並提供了olap分析行為藉口,前端能夠識別這個olap模型。其實,olap技術只是定義了一些模型,並未定義如何實現,每個專業產商都有自己的實現和理念。有些產商的產品根本就沒有olap產品,它也能實現olap分析功能。 [/color]

資料倉儲,什麼是資料倉儲?

資料倉儲,英文名稱為data warehouse,可簡寫為dw或dwh。資料倉儲是為企業所有級別的決策制定過程提供支援的所有型別資料的戰略集合。它是單個資料儲存,出於分析性報告和決策支援的目的而建立。為企業提供需要業務智慧型來指導業務流程改進和監視時間 成本 質量和控制。資料倉儲是決策支援系統 ds...

什麼是資料倉儲

我們都知道,利用多種不同的企業資料庫提取資料進行業務決策是一件複雜的工作。而資料倉儲的主要優點就是可以將這些不同的資料整合在乙個 儲存環境中,並提供給使用者必須的olap online analytical processing,聯機分析處理 工具來檢索與業務有關的資料。當你聽到資料倉儲 data ...

什麼是資料倉儲

分享一下我老師大神的人工智慧教程!零基礎,通俗易懂!資料倉儲系統體系結構 資料來源 是資料倉儲系統的基礎,是整個系統的資料源泉。通常包括企業內部資訊和外部資訊。內部資訊包括存放於rdbms中的各種業務處理資料和各類文件資料。外部資訊包括各類法律法規 市場資訊和競爭對手的資訊等等 資料的儲存與管理 是...