資料探勘概念與技術8 資料倉儲的概念

2022-08-02 01:03:11 字數 1027 閱讀 6625

1.資料倉儲的定義

資料倉儲是乙個面向主題的,整合的,時變的和非易失的資料集合,支援管理部門的決策過程。

面向主題的:資料倉儲都圍繞一些主題來組織:如顧客,**商,產品和銷售等某一特定的目的,而非組織機構的日常操作和事務管理。即:資料倉儲排除對於決策無用的資料,它提供的是特定主題的簡明檢視。

整合的:構建資料倉儲是將多個資料來源的資料整合在一起,資料來源可以是:關聯式資料庫,一般檔案,聯機事務記錄。在此處用到前面所述資料清理和資料整合技術。

時變的:資料儲存從歷史的角度提供資訊(例如過去3個月,5-10年等)。

非易失的:資料倉儲總是物理的分別存放資料,他不需要事務處理,恢復和併發控制機制,只需要進行資料的初始存入和訪問。

2.運算元據庫與資料倉儲的區別

聯機運算元據庫系統,這種系統被稱作聯機事務處理系統(oltp),它涵蓋了組織機構的大部分日常操作,如購物,庫存,製造,註冊,記賬等;    

資料倉儲系統,這種系統被稱作聯機分析處理系統(olap),主要用於為知識工人,用於決策提供支援。

主要區別:

使用者和系統面向性。oltp面向顧客,olap面向市場。

資料內容。oltp管理當前資料,olap管理歷史資料,提供彙總和聚集機制,在不同粒度級別上儲存和管理資訊。

資料庫設計。oltp系統採用實體聯絡資料模型並面向應用;olap系統採用星型和雪花模型並面向主題。

檢視。oltp關注當前資料。olap常常跨越資料庫模式的多個版本,並且還處理來自不同組織的資訊,可能存放在多個儲存介質上。

訪問模式。oltp主要由短的原子事務組成,並需要併發控制和回覆機制。

2.為什麼不在運算元據庫上進行聯機分析處理,還要使用分離的資料倉儲?

1. 兩者由於目的的不同,資料倉儲的查詢複雜,需要建立多維的資料組織,訪問方法和實現方法。對運算元據庫進行複雜的olap查詢,會降低操作的任務的效能。

2.併發控制和恢復機制用於olap這種唯讀操作會危害並行事務的執行。

資料探勘概念與技術10 資料倉儲的系統結構

1.資料倉儲設計的四種檢視 資料來源檢視 揭示運算元據庫系統收集,儲存和管理的資訊。這些資訊可能以不同的詳細程度和精度建模,存放在由個別資料來源表到整合資料來源表中。通常,用傳統的資料建模技術,如實體 聯絡模型或case工具建模。資料倉儲檢視 包括事實表和維表,提供存放資料倉儲內部的資訊,包括預計算...

資料探勘 資料倉儲

雖然存在資料倉儲並不是資料探勘的先決條件,但實際上,若能訪問資料倉儲,資料探勘的任務就會變得容易的多。資料倉儲的主要目標是增加決策過程的 情報 和此過程的相關人員的知識。資料倉儲對不同的人來說有不同的意義。資料倉儲是乙個整合的,面向主題的資料庫集合,用於實現決策支援功能 dsf 其中的每個資料單元都...

資料倉儲(OLAP OLTP)與資料探勘

一 挖掘資料存在問題 1 把來自各個資料來源的資料匯集到乙個中心倉庫中,即資料倉儲。資料倉儲位於乙個單獨的節點上,使用同一的模式從多個資料來源收集資料,給使用者提供乙個單獨的 統一的資料介面,目的是能在不同的資料上高效執行查詢。2 分析收集到的資料發現可以成為商務決策基礎的資訊或知識。資料探勘 目標...