聯機分析處理(OLAP)

2021-03-31 14:39:38 字數 2395 閱讀 8042

聯機分析處理 (olap) 的概念最早是由關聯式資料庫之父e.f.codd於2023年提出的,他同時提出了關於olap的12條準則。olap的提出引起了很大的反響,olap作為一類產品同聯機事務處理 (oltp) 明顯區分開來。

當今的資料處理大致可以分成兩大類:聯機事務處理oltp(on-line transaction processing)、聯機分析處理olap(on-line analytical processing)。oltp是傳統的關係型資料庫的主要應用,主要是基本的、日常的事務處理,例如銀行交易。olap是資料倉儲系統的主要應用,支援複雜的分析操作,側重決策支援,並且提供直觀易懂的查詢結果。下表列出了oltp與olap之間的比較。

oltp

olap

使用者操作人員,低層管理人員

決策人員,高階管理人員

功能日常操作處理

分析決策

db 設計

面向應用

面向主題

資料當前的, 最新的細節的, 二維的分立的

歷史的, 聚集的, 多維的整合的, 統一的

訪問讀/寫數十條記錄

讀上百萬條記錄

工作單位

簡單的事務

複雜的查詢

使用者數上千個

上百個db 大小

100mb-gb

100gb-tb

olap是使分析人員、管理人員或執行人員能夠從多角度對資訊進行快速、一致、互動地訪問,從而獲得對資料的更深入了解的一類軟體技術。olap的目標是滿足決策支援或者滿足在多維環境下特定的查詢和報表需求,它的技術核心是"維"這個概念。

「維」是人們觀察客觀世界的角度,是一種高層次的型別劃分。「維」一般包含著層次關係,這種層次關係有時會相當複雜。通過把乙個實體的多項重要的屬性定義為多個維(dimension),使使用者能對不同維上的資料進行比較。因此olap也可以說是多維資料分析工具的集合。

olap的基本多維分析操作有鑽取(roll up和drill down)、切片(slice)和切塊(dice)、以及旋轉(pivot)、drill across、drill through等。

·鑽取是改變維的層次,變換分析的粒度。它包括向上鑽取(roll up)和向下鑽取(drill down)。roll up是在某一維上將低層次的細節資料概括到高層次的彙總資料,或者減少維數;而drill down則相反,它從彙總資料深入到細節資料進行觀察或增加新維。

·切片和切塊是在一部分維上選定值後,關心度量資料在剩餘維上的分布。如果剩餘的維只有兩個,則是切片;如果有三個,則是切塊。

·旋轉是變換維的方向,即在**中重新安排維的放置(例如行列互換)。

olap有多種實現方法,根據儲存資料的方式不同可以分為rolap、molap、holap。

rolap表示基於關聯式資料庫的olap實現(relational olap)。以關聯式資料庫為核心,以關係型結構進行多維資料的表示和儲存。rolap將多維資料庫的多維結構劃分為兩類表:一類是事實表,用來儲存資料和維關鍵字;另一類是維表,即對每個維至少使用乙個表來存放維的層次、成員類別等維的描述資訊。維表和事實表通過主關鍵字和外關鍵字聯絡在一起,形成了"星型模式"。對於層次複雜的維,為避免冗餘資料占用過大的儲存空間,可以使用多個表來描述,這種星型模式的擴充套件稱為"雪花模式"。

molap表示基於多維資料組織的olap實現(multidimensional olap)。以多維資料組織方式為核心,也就是說,molap使用多維陣列儲存資料。多維資料在儲存中將形成"立方塊(cube)"的結構,在molap中對"立方塊"的"旋轉"、"切塊"、"切片"是產生多維資料包表的主要技術。

holap表示基於混合資料組織的olap實現(hybrid olap)。如低層是關係型的,高層是多維矩陣型的。這種方式具有更好的靈活性。

還有其他的一些實現olap的方法,如提供乙個專用的sql server,對某些儲存模式(如星型、雪片型)提供對sql查詢的特殊支援。

olap工具是針對特定問題的聯機資料訪問與分析。它通過多維的方式對資料進行分析、查詢和報表。維是人們觀察資料的特定角度。例如,乙個企業在考慮產品的銷售情況時,通常從時間、地區和產品的不同角度來深入觀察產品的銷售情況。這裡的時間、地區和產品就是維。而這些維的不同組合和所考察的度量指標構成的多維陣列則是olap分析的基礎,可形式化表示為(維1,維2,……,維n,度量指標),如(地區、時間、產品、銷售額)。多維分析是指對以多維形式組織起來的資料採取切片(slice)、切塊(dice)、鑽取(drill-down和roll-up)、旋轉(pivot)等各種分析動作,以求剖析資料,使使用者能從多個角度、多側面地觀察資料庫中的資料,從而深入理解包含在資料中的資訊。

根據綜合性資料的組織方式的不同,目前常見的olap主要有基於多維資料庫的molap及基於關聯式資料庫的rolap兩種。molap是以多維的方式組織和儲存資料,rolap則利用現有的關聯式資料庫技術來模擬多維資料。在資料倉儲應用中,olap應用一般是資料倉儲應用的前端工具,同時olap工具還可以同資料探勘工具、統計分析工具配合使用,增強決策分析功能。

OLAP(聯機分析處理)

什麼是聯機分析處理 olap 聯機分析處理 olap 的概念最早是由關聯式資料庫之父e.f.codd於1993年提出的,他同時提出了關於olap的12條準則。olap的提出引起了很大的反響,olap作為一類產品同聯機事務處理 oltp 明顯區分開來。當今的資料處理大致可以分成兩大類 聯機事務處理ol...

OLAP(聯機分析處理)

什麼是聯機分析處理 olap 聯機分析處理 olap 的概念最早是由關聯式資料庫之父e.f.codd於1993年提出的,他同時提出了關於olap的12條準則。olap的提出引起了很大的反響,olap作為一類產品同聯機事務處理 oltp 明顯區分開來。當今的資料處理大致可以分成兩大類 聯機事務處理ol...

什麼是聯機分析處理(OLAP)

聯機分析處理 olap 的概念最早是由關聯式資料庫之父e.f.codd於1993年提出的,他同時提出了關於olap的12條準則。olap的提出引起了很大的反響,olap作為一類產品同聯機事務處理 oltp 明顯區分開來。當今的資料處理大致可以分成兩大類 聯機事務處理oltp on line tran...