資料倉儲(十) OLAP技術

2021-06-14 17:08:23 字數 1055 閱讀 4785

olap伺服器通常採用多維模型(inmon認為多維模型應當用在資料集市上,而資料倉儲應採用關係模型;kimball認為可以直接採用多維模型建立維度資料倉儲。二人均認可多維模型,只是應用場景不同),其具體實現可分為:

rolap(關係型聯機分析處理):rolap基本資料和聚合資料均存放在rdbms之中。

molap(多維聯機分析處理):molap基本資料和聚合資料均存放於多維資料庫中。

holap(混合型聯機分析處理):holap基本資料存放於rdbms之中,聚合資料存放於多維資料庫中。

多維資料庫(multi dimensional database,mdd)可以簡單地理解為:將資料存放在乙個n維陣列中,而不是像關聯式資料庫那樣以記錄的形式存放。因此它存在大量稀疏矩陣,人們可以通過多維檢視來觀察資料。多維資料庫增加了乙個時間維,與關聯式資料庫相比,它的優勢在於可以提高資料處理速度,加快反應時間,提高查詢效率。

mdd並沒有公認的多維模型(關係型資料庫的多維模型通常採用星型模式),也沒有像關係模型那樣標準地取得資料的方法(如sql、api等)。基於mdd的olap產品,依據決策支援的內容使用範圍也有很大的不同。詳見:多維資料庫

olap的基本多維分析操作有鑽取(roll up和drill down)、切片(slice)和切塊(dice)、以及旋轉(pivot)等。

切片(slice)在多維陣列的某一維上選定乙個維成員的動作稱為切片(定義一)。即在多維陣列(維1,維2,……,維n,變數)中選一維,如維i,指定其值vi,所得到的多維陣列的乙個子集(維1,維2,……維成員vi,……維n,變數)。其中維成員是維的乙個取值。

定義二:選定多維陣列的乙個二維子集的動作叫做切片。選定兩個維,指定這兩個維的值分別取某個區間,其餘維都取定乙個值(或維成員),得到的就是多維陣列在兩個維上的乙個二維子集。注意:定義一中,選乙個維,指定乙個值,而非指定取值區間。

切塊(dice)

定義一:在多維陣列的某一維上選定某一區間的維成員的動作稱為切塊,即限制多維陣列的某一維的取值區間。

定義二:選定多維陣列的乙個三維子集的動作稱為切塊。即選定3個維,這三個維度上取某一區間或任意的維成員,而其餘的維都取定乙個維成員,則得到在三個維上的乙個三維子集。

資料倉儲 OLAP

1.什麼是資料倉儲 資料倉儲是面向主題的 整合的 隨時間變化的 不容易丟失的資料集合,支援管理部門的決策過程 2.oltp和olap的區別 使用者和系統的面向性 顧客vs市場 資料內容 當前的 詳細的資料vs歷史的 彙總的資料 資料庫設計 實體 聯絡模型 er 和面向應用的資料庫設計vs星形 雪花型...

資料倉儲及OLAP分析

資料倉儲是儲存資料的一種組織形式,它從傳統資料庫中獲得原始資料,先按輔助決策的主題要求形成當前基本資料層,再按綜合決策的要求形成綜合資料層 又可分為輕度綜合層和高度綜合層 隨著時間的推移,由時間控制機制將當前基本資料層轉為歷史資料層。可見資料倉儲中邏輯結構資料由3層到 4層資料組成,它們均由元資料 ...

資料倉儲和OLAP(概念)

簡寫為olap,隨著資料庫技術的發展和應用,資料庫儲存的資料量從20世紀80年代的兆 m 位元組及千兆 g 位元組過渡到現在的兆兆 t 位元組和千兆兆 p 位元組,同時,使用者的查詢需求也越來越複雜,涉及的已不僅是查詢或操縱一張關係表中的一條或幾條記錄,而且要對多張表中千萬條記錄的資料進行資料分析和...