簡述資料庫和資料倉儲的區別

2021-10-09 08:47:41 字數 1787 閱讀 2363

簡單的來說,資料庫偏向於管理和儲存,資料倉儲偏向於整合和分析

資料庫:傳統的關係型資料庫的應用,主要是基本的、日常的事務處理,更關注業務交易處理(oltp)

資料倉儲:資料倉儲支援複雜的分析操作,側重決策支援,並且提供直觀易懂的查詢效果,更關注資料分析層面(olap)

隨著業務指數級的增長,資料量陡增,從最初粗放的資料分析逐步演化為角色和場景都非常精細化的集群分析。這類非常具體,且能夠對公司決策起到關鍵性作用的資料,很難從業務資料庫中調取出來,主要原因是:

1、業務資料庫中的資料結構是為了完成交易設計的,不是為了查詢和分析的便利設計的

2、業務資料庫大多數是讀寫優化的,對於大量資料的讀(查詢指標,一般是唯讀型別的資料查詢)的支援不足

資料倉儲的作用在於:

1、資料結構的設計更偏向於查詢和分析

2、唯讀優化的資料庫,對於資料寫入的速度要求不高,只需要做大量資料的複雜查詢的速度夠快就可以了。

資料模型上的區別:

資料庫:主要遵從正規化模型(1nf,2nf,3nf,等等),從而盡可能減少資料冗餘,保證資料引用的完整性。

產品實現上的區別:

資料庫:通常使用行式儲存,如oracle,microsoft sql server等

資料倉儲:通常使用列式儲存,如sap iq,hive等

二、資料倉儲和資料庫的區別

資料庫軟體:是一種軟體(並不是鏈結資料庫的圖形化客戶端)。用來實現資料庫邏輯過程,屬於物理層。

資料庫:是一種邏輯概念,用來存放資料的倉庫,通過資料庫軟體來實現。資料庫由很多表組成,表是二維的,一張表裡面有很多字段。字段一字排開,對資料就一行一行的寫入表中。資料庫的表,在於能夠用二維表現多維的關係。如:oracle、db2、mysql、sybase、mssql server等。

資料倉儲:是資料庫概念的公升級。從邏輯上理解,資料庫和資料倉儲沒有區別,都是通過資料庫軟體實現存放資料的地方,只不過從資料量來說,資料倉儲要比資料庫更龐大德多。資料倉儲主要用於資料探勘和資料分析,輔助領導做決策;

資料倉儲是bi下的其中一種技術。由於資料庫跟業務應用掛鉤的,所以乙個資料庫不可能裝下一家公司的所有資料。資料庫的表設計往往是針對某乙個應用進行設計的。比如剛剛的登入功能,這張user表上就只有這兩個字段,沒有別的欄位了。到那時這張表符合應該,沒有問題,但是這張表不符合分析。比如我想知道在哪個時間段,使用者的量最多?哪個使用者一年購物最多?諸如此類的指標。那就要從新設計資料庫的表結構了。對於資料分析和資料探勘,我們引入了資料倉科概念。資料倉儲的表結構是依照分析需求,分析維度,分析指標進行設計的。

資料庫與資料倉儲的區別實際講的是oltp與olap的區別。

操作型處理,叫聯機事務處理oltp(on-line transaction processing),也可以稱面向交易的處理系統,它是針對具體業務在資料庫聯機的日常操作,通常對少數記錄進行查詢、修改。使用者較為關心操作的響應時間、資料的安全性、完整性和併發的支援使用者數等問題。傳統的資料庫系統作為資料管理的主要手段,主要用於操作型處理。

分析型處理,叫聯機分析處理olap(on-line analytical processing)一般針對某些主題歷史資料進行分析,支援管理決策。

操作型處理 分析型處理

細節的 綜合或者提煉的

實體-關係(e-r)模型 星型模型或雪花模型

儲存瞬間資料 儲存歷史資料,不包含最近的資料

可更新的 唯讀、只追加

一次操作乙個單元 一次操作乙個集合

效能要求高,響應時間短 效能要求寬鬆

面向事務 面向分析

一次運算元據量小 支援決策需求

資料量小 資料量大

客戶訂單、庫存水平和銀行賬戶查詢 客戶收益分析、市場細分

資料庫和資料倉儲的區別

資料庫設計是盡量避免冗餘,一般採用符合正規化的規則來設計,資料倉儲在設計是有意引入冗餘,採用反正規化的方式來設計。資料庫是為捕獲資料而設計,資料倉儲是為分析資料而設計,它的兩個基本的元素是維表和事實表。維是看問題的角度,比如時間,部門,維表放的就是這些東西的定義,事實表裡放著要查詢的資料,同時有維的...

資料庫和資料倉儲的區別

一 資料倉儲的概念 資料倉儲之父比爾 恩門 bill inmon 在1991年出版的 building the data warehouse 建立資料倉儲 一書中所提出的定義被廣泛接受 資料倉儲 data warehouse 是乙個面向主題的 subject oriented 整合的 integra...

資料庫和資料倉儲的區別

資料庫設計是盡量避免冗餘,一般採用符合正規化的規則來設計,資料倉儲在設計是有意引入冗餘,採用反正規化的方式來設計。資料庫是為捕獲資料而設計,資料倉儲是為分析資料而設計,它的兩個基本的元素是維表和事實表。維是看問題的角度,比如時間,部門,維表放的就是這些東西的定義,事實表裡放著要查詢的資料,同時有維的...