資料倉儲技術簡介2 下

2021-08-29 10:41:57 字數 1023 閱讀 9398

資料倉儲的第三個問題是針對決策支援查詢的優化。這個問題主要針對關聯式資料庫而言,因為其它資料管理環境連基本的通用查詢能力都還不完善。在技術上,針對決策支援的優化涉及資料庫系統的索引機制、查詢優化器、連線策略、資料排序和取樣等諸多部分。普通關聯式資料庫採用b樹類的索引,對於性別、年齡、地區等具有大量重複值的字段幾乎沒有效果。而擴充的關聯式資料庫則引入了點陣圖索引的機制,以二進位制位表示欄位的狀態,將查詢過程變為篩選過程,單個計算機的基本操作便可篩選多條記錄。由於資料倉儲中各資料表的資料量往往極不均勻,普通查詢優化器所得出得最佳查詢路徑可能不是最優的。因此,面向決策支援的關聯式資料庫在查詢優化器上也作了改進,同時根據索引的使用特性增加了多重索引掃瞄的能力。

以關聯式資料庫建立的資料倉儲在應用時會遇到大量的表間連線操作,而連線操作對於關聯式資料庫來說是一件耗時的操作。擴充的關聯式資料庫中對連線操作可以做預先的定義,我們稱之為連線索引,使得資料庫在執行查詢時可直接獲取資料而不必實施具體的連線操作。資料倉儲的查詢常常只需要資料庫中的部分記錄,如最大的前50家客戶,等等。普通關聯式資料庫沒有提供這樣的查詢能力,只好將整個表的記錄進行排序,從而耗費了大量的時間。決策支援的關聯式資料庫在此做了改進,提供了這一功能。此外,資料倉儲的查詢並不需要像事務處理系統那樣精確,但在大容量資料環境中需要有足夠短的系統響應時間。因此,一些資料庫系統增加了取樣資料的查詢能力,在精確度允許的範圍內,大幅度提高系統查詢效率。

總之,將普通關聯式資料庫改造成適合擔當資料倉儲的伺服器有許多任務作可以做,它已成為關聯式資料庫技術的乙個重要研究課題和發展方向。可見,對於決策支援的擴充是傳統關聯式資料庫進入資料倉儲市場的重要技術措施。

資料倉儲的第四個問題是支援多維分析的查詢模式,這也是關聯式資料庫在資料倉儲領域遇到的最嚴峻的挑戰之一。使用者在使用資料倉儲時的訪問方式與傳統的關聯式資料庫有很大的不同。對於資料倉儲的訪問往往不是簡單的表和記錄的查詢,而是基於使用者業務的分析模式,即聯機分析。如圖1.3所示,它的特點是將資料想象成多維的立方體,使用者的查詢便相當於在其中的部分維(稜)上施加條件,對立方體進行切片、分割,得到的結果則是數值的矩陣或向量,並將其製成圖表或輸入數理統計的演算法。

圖 1.3 聯機分析資料處理示意圖

資料倉儲技術簡介1 上

資料倉儲是近年來興起的一種新的資料庫應用。在各大資料庫廠商紛紛宣布產品支援資料倉儲並提出一整套用以建立和使用資料倉儲的產品是,業界掀起了資料庫熱。比如informixgongside公司的資料倉儲解決方案 oracle公司的資料倉儲解決方案 sybase公司的互動式資料倉儲解決方案等等。這同時也引起...

資料倉儲技術簡介3 上

事實上,將大量的業務資料應用於分析和統計原本是乙個非常簡單和自然的想法。但在實際的操作中,人們卻發現要獲得有用的資訊並非如想象的那麼容易,這主要表現在以下幾點 所有聯機事務處理強調的是密集的資料更新處理效能和系統的可靠性,並不關心資料查詢的方便與快捷。聯機分析和事務處理對系統的要求不同,同乙個資料庫...

資料倉儲簡介

資料倉儲領域的權威w h inmon給出了資料倉儲的乙個簡短而全面的定義 資料倉儲是乙個面向主題 整合 時變 非易失的資料集合,是支援管理部門的決策過程。根據該定義,資料倉儲具備以下四個關鍵特徵 1.1 面向主題 subject oriented 的資料集合 資料倉儲通常圍繞一些主題,如 產品 銷售...