資料倉儲的概念

2021-05-27 00:09:30 字數 906 閱讀 8552

資料倉儲現在大家說的很多,但有乙個基本清晰的認識是比較好的。我覺得《資料倉儲》一本書給的概念挺好,寫出來做個筆記。「資料倉儲是乙個面向主題的、整合的、非易失的、隨時間變化的用來支援管理人員角色的資料集合。」這裡在加上一點資料是具有粒度化的。

第一點 面向主題

面向主題其實就是我們要按照乙個目的去儲存資料,用資料去表現某乙個特定的內容。對於乙個保險公司來說,主題可能是顧客、保險單、保險費、索賠。對於乙個生產廠家來說主題可能是成本、訂單、原材料、銷售商。

第二點 整合的

資料倉儲的資料**是多種多樣的,具體點說可能是報紙、儲存在oracle中的子應用的資料,儲存在部門的一些資料,而它可以使用儲存在任何可用的工具中,總之只要是能找到資料地方都是他的**,對於應用程式來說,每個資料模型的建造者都有自己的設計風格,在設計自己的應用時,不會考慮以後的資料要和其他方面的資料結合在一起,這也是沒有必要的,未來的事情誰知道呢。所以這就存在了很多的不一致性。舉乙個簡單的例子。比如儲存使用者的性別,甲可能用0、1表示,乙可能用m/w表示,但在資料倉儲我們要把它變成一致性,不論你用0、1還是m/w,總之你只能用乙個。整合處理大多數就是所謂etl過程。

第三點 非易失

資料倉儲的資料當然是非易失的,你認為呢,資料倉儲儲存的是歷史資料,是某一資訊各種歷史快照,我們無需修改什麼,只要把每次的資料的歷史快照匯入倉庫中即可。當然像我涉及到專案中,甲方自己的歷史資料就是錯的,那就不能按常理出牌了。呵呵。

第四點 隨時間變化的

資料倉儲裡時間關鍵字很重要,資料倉儲儲存資料千萬不要忘記時間,因為它儲存的是資訊某一時間的快照,失去了時間元素,資料倉儲也就沒用了。

第五點 資料具有粒度化 

恩,這個其實也很好理解。在倉庫中我們可以儲存相當詳細的資料,但如果詳細的資料對於我們來說過於龐大,而且對產品沒有用,我們可以做輕微的彙總。

資料倉儲的概念

隨著市場競爭的加劇和資訊社會需求的發展,從大量資料中提取 檢索 查詢等 制定市場策略的資訊就顯得越來越重要了。這種需求既要求聯機服務,又涉及大量用 於決策的資料,而傳統的資料庫系統已無法滿足這種需求。其具體體現在三個方面 歷史資料量很大。輔助決策資訊涉及許多部門的資料,而不同系統的資料難以整合。由於...

資料倉儲的概念

隨著市場競爭的加劇和資訊社會需求的發展,從大量資料中提取 檢索 查詢等 制定市場策略的資訊就顯得越來越重要了。這種需求既要求聯機服務,又涉及大量用 於決策的資料,而傳統的資料庫系統已無法滿足這種需求。其具體體現在三個方面 歷史資料量很大。輔助決策資訊涉及許多部門的資料,而不同系統的資料難以整合。由於...

資料倉儲(六) 資料倉儲的概念設計

在資料集市設計中可以使用3種基本的系統方法 資料驅動的方法 需求驅動的方法和混合方法。它們的區別在於源資料庫分析和終端使用者需求分析階段所佔的比重。方法的選擇將極大地影響概念設計的方式。資料驅動方法包括 基於實體 關係模式的設計 基於關係模式的設計 基於xml模式的設計。概念型實體 關係模式比關係型...