資料庫和資料倉儲

2021-07-14 08:12:42 字數 1396 閱讀 6178

資料庫和資料倉儲

資料庫是事務系統的資料平台,資料庫中儲存了各項交易的記錄。 資料倉儲是分析系統的資料平台,從事務系統中獲取資料,進行一系列的資料彙總、計算、分析。將分析得到的資料存到資料倉儲中。

比如,在噹噹上進行一筆買書交易,交易記錄就存在資料庫中,那麼對這些資料(購買量)進行分析可以得到書類在地區的受歡迎程度,從而根據這些分析資料結果,將書以合適的數量分配在各個地區的倉庫。

主要區別總結

資料庫是面向事務的設計,資料倉儲是面向主題設計的。

資料庫設計是盡量避免冗餘,資料倉儲在設計是有意引入冗餘。

資料庫是為捕獲資料而設計,資料倉儲是為分析資料而設計。

資料倉儲(data warehouse)是乙個面向主題的(subject oriented)、整合的(integrated)、相對穩定的(non-volatile)、反映歷史變化(time variant)的資料集合,用於支援管理決策(decision ****** support)。 —資料倉儲之父

資料倉儲,是在資料庫已經大量存在的情況下,為了進一步挖掘資料資源、為了決策需要而產生的。

主要功能仍是將組織透過資訊系統之聯機事務處理(oltp)經年累月所累積的大量資料,透過資料倉儲理論所特有的資料儲存架構,作一有系統的分析整理,以利各種分析方法如聯機分析處理(olap)、資料探勘(data mining)之進行,並進而支援如決策支援系統(dss)、資料倉儲技術(eis)之建立,幫助決策者能快速有效的自大量資料中,分析出有價值的資訊,以利決策擬定及快速回應外在環境變動,幫助建構商業智慧型(bi)。

etl,是英文 extract-transform-load 的縮寫,用來描述將資料從**端經過抽取(extract)、轉換(transform)、載入(load)至目的端的過程。

etl是構建資料倉儲的重要一環,使用者從資料來源抽取出所需的資料,經過資料清洗,最終按照預先定義好的資料倉儲模型,將資料載入到資料倉儲中去。

效率足夠高。資料倉儲的分析資料一般分為日、周、月、季、年等,可以看出,日為週期的資料要求的效率最高,要求24小時甚至12小時內,客戶能看到昨天的資料分析。由於有的企業每日的資料量很大,設計不好

的資料倉儲經常會出問題,延遲1-3日才能給出資料,顯然不行的。

資料質量。資料倉儲所提供的各種資訊,肯定要準確的資料,但由於資料倉儲流程通常分為多個步驟,包括資料清洗,裝載,查詢,展現等等,複雜的架構會更多層次,那麼由於資料來源有髒資料或者**不嚴謹,都可以導致資料失真,客戶看到錯誤的資訊就可能導致分析出錯誤的決策,造成損失,而不是效益。

擴充套件性。之所以有的大型資料倉儲系統架構設計複雜,是因為考慮到了未來3-5年的擴充套件性,這樣的話,未來不用太快花錢去重建資料倉儲系統,就能很穩定執行。主要體現在資料建模的合理性,資料倉儲方案中多出一些中間層,使海量資料流有足夠的緩衝,不至於資料量大很多,就執行不起來了。

資料倉儲和資料庫

資料倉儲 英文名稱為data warehouse,可簡寫為 dw或dwh。資料倉儲,是為 企業所有級別的決策制定過程,提供所有型別資料支援的戰略 集合。它是單個資料儲存,出於分析性報告和決策支援目的而建立。為需要業務智慧型的企業,提供指導業務流程改進 監視時間 成本 質量以及控制。企業的資料處理大致...

資料庫和資料倉儲的區別

資料庫設計是盡量避免冗餘,一般採用符合正規化的規則來設計,資料倉儲在設計是有意引入冗餘,採用反正規化的方式來設計。資料庫是為捕獲資料而設計,資料倉儲是為分析資料而設計,它的兩個基本的元素是維表和事實表。維是看問題的角度,比如時間,部門,維表放的就是這些東西的定義,事實表裡放著要查詢的資料,同時有維的...

資料庫和資料倉儲區別

簡而言之,資料庫是面向事務的設計,資料倉儲是面向主題設計的。資料庫設計是盡量避免冗餘,一般採用符合正規化的規則來設計,資料倉儲在設計是有意引入冗餘,採用反正規化的方式來設計。資料庫是為捕獲資料而設計,資料倉儲是為分析資料而設計,它的兩個基本的元素是維表和事實表。維是看問題的角度,比如時間,部門,維表...