資料倉儲和資料庫的區別

2021-09-10 19:10:41 字數 2164 閱讀 4082

**:

一、資料倉儲

1.什麼是資料倉儲?

資料倉儲(data warehouse),可簡寫為dw或dwh,資料倉儲,是為了企業所有級別的決策制定計畫過程,提供所有型別資料型別的戰略集合。它出於分析性報告和決策支援的目的而建立。為需要業務智慧型的企業 ,為需要指導業務流程改進、監視時間,成本,質量以及控制等;

2. 資料倉儲能幹什麼?(舉幾個栗子)

1.年度銷售目標的制定,需要根據以往的歷史報表進行決策,不能隨便制定。

2.優化業務流程

例如:某電商平台某品牌的手機,在過去5年主要的的購買人群的年齡在什麼年齡段,在那個季節購買量人多,這樣就可以根據這個特點為目標人群設定他們主要的需求和動態分配產生的生產量,和倉庫的庫存。

3. 資料倉儲的特點

1. 資料倉儲是面向主題的。

1.與傳統的資料庫不一樣,資料倉儲是面向主題的,那什麼是主題呢?首頁主題是乙個較高乘次的概念,是較高層次上企業資訊系統中的資料綜合,歸類並進行分析的物件。在邏輯意義上,他是對企業中某乙個巨集觀分析領域所涉及的分析物件。(說人話:就是使用者用資料倉儲進行決策所關心的重點方面,乙個主題通常與多個操作資訊型系統有關,而操作型資料庫的資料組織面向事務處理任務,各個任務之間是相互隔離的);

2.資料倉儲是整合的。

1.資料倉儲的資料是從原來的分散的資料庫資料(mysql等關係型資料庫)抽取出來的。操作型資料庫與dss(決策支援系統)分析型資料庫差別甚大。第一,資料倉儲的每乙個主題所對應的源資料在所有的各個分散的資料庫中,有許多重複和不一樣的地方,且**於不同的聯機系統的資料都和不同的應用邏輯**在一起;第二,資料倉儲中的綜合資料不能從原來有的資料庫系統直接得到。因此子在資料進入資料倉儲之前,必然要經過統一與綜合,這一步是資料倉儲建設中最關鍵,最複雜的一步,所要挖成的工作有:

1.要統計源資料中所有矛盾之處,如字段的同名異議、異名同義、單位不統一,字長不統一等。

2. 進行資料的綜合和計算。資料倉儲中的資料綜合工作可以在原有資料庫抽取資料時生成,但許多是在資料倉儲內部生成的,即進入資料倉儲以後進行綜合生成的。

3.資料倉儲的資料是隨著時間的變化而變化的。

1.資料倉儲中的資料不可更新是針對應用來說的,也就是說,資料倉儲的使用者進行分析處理是不進行資料更新操作的。但並不是說,在從資料整合輸入資料倉儲開始到最後被刪除的整個生存週期中,所有的資料倉儲資料都是永遠不變的。

2.資料倉儲的資料是隨著時間變化而變化的,這是資料倉儲的特徵之一。這一特徵主要有以下三個表現:

1.資料倉儲隨著時間變化不斷增加新的資料內容。資料倉儲系統必須不斷捕捉oltp資料庫中變化的資料,追加到資料倉儲當中去,也就是要不斷的生成oltp資料庫的快照,經統一整合增加到資料倉儲中去;但對於確實不在變化的資料庫快照,如果捕捉到新的變化資料,則只生成乙個新的資料庫快照增加進去,而不會對原有的資料庫快照進行修改。

2.資料庫隨著時間變化不斷刪去舊的資料內容 。資料倉儲內的資料也有儲存期限,一旦過了這一期限,過期資料就要被刪除。只是資料庫內的資料時限要遠遠的長於操作型環境中的資料時限。在操作型環境中一般只儲存有60~90天的資料,而在資料倉儲中則要需要儲存較長時限的資料(例如:5~10年),以適應dss進行趨勢分析的要求。

3. 資料倉儲中包含有大量的綜合資料,這些綜合資料中很多跟時間有關,如資料經常按照時間段進行綜合,或隔一定的時間片進行抽樣等等。這些資料要隨著時間的變化不斷地進行從新綜合。因此資料倉儲的資料特徵都包含時間項,以標明資料的歷史時期。

4.資料倉儲的資料是不可修改的。

1.資料倉儲的資料主要提供企業決策分析之用,所涉及的資料操作主要是資料查詢,一般情況下並不進行修改操作。資料倉儲的資料反映的是一段相當長的時間內歷史資料的內容,是不同時點的資料庫快照的集合, 以及基於這些快照進行統計、綜合和重組的匯出資料,而不是聯機處理的資料。資料庫中進行聯機處理的書庫進過整合輸入到資料倉儲中,一旦資料倉儲存放的資料已經超過資料倉儲的資料儲存期限,這些資料將從當前的資料倉儲中刪去。因為資料倉儲只進行資料查詢操作,所以資料倉儲當中的系統要比資料庫中的系統要簡單的多。資料庫管理系統中許多技術難點,如完整性保護、併發控制等等,在資料倉儲的管理中幾乎可以省去。但是由於資料倉儲的查詢資料量往往很大,所以就對資料查詢提出了更高的要求,他要求採用各種複雜的索引技術;同時資料倉儲面向的是商業企業的高層管理層,他們會對資料查詢的介面友好性和資料表示提出更高的要求;

二、資料倉儲和資料庫的區別

資料庫和資料倉儲的區別

資料庫設計是盡量避免冗餘,一般採用符合正規化的規則來設計,資料倉儲在設計是有意引入冗餘,採用反正規化的方式來設計。資料庫是為捕獲資料而設計,資料倉儲是為分析資料而設計,它的兩個基本的元素是維表和事實表。維是看問題的角度,比如時間,部門,維表放的就是這些東西的定義,事實表裡放著要查詢的資料,同時有維的...

資料庫和資料倉儲的區別

一 資料倉儲的概念 資料倉儲之父比爾 恩門 bill inmon 在1991年出版的 building the data warehouse 建立資料倉儲 一書中所提出的定義被廣泛接受 資料倉儲 data warehouse 是乙個面向主題的 subject oriented 整合的 integra...

資料庫和資料倉儲的區別

資料庫設計是盡量避免冗餘,一般採用符合正規化的規則來設計,資料倉儲在設計是有意引入冗餘,採用反正規化的方式來設計。資料庫是為捕獲資料而設計,資料倉儲是為分析資料而設計,它的兩個基本的元素是維表和事實表。維是看問題的角度,比如時間,部門,維表放的就是這些東西的定義,事實表裡放著要查詢的資料,同時有維的...