關於資料倉儲 總體工具介紹

2021-09-22 04:31:31 字數 2249 閱讀 1577

資料倉儲專案是以關聯式資料庫為依託,以資料倉儲理論為指導、以 olap為多層次多視角分析,以 etl工具進行資料整合、整合、清洗、載入轉換,以前端工具進行前端報表展現瀏覽,以反覆疊代驗證為生命週期的綜合處理過程。最終目標是為了達到整合企業資訊資訊,把資料轉換成資訊、知識,提供決策支援。

資料倉儲不是一門純粹的技術,如果從 oracle、 sqlserver等專業資料庫的角度去學習,就有失偏頗了。資料倉儲應該是一種體系結構,它的核心是在於對於資料的整合,通過抽絲剝繭把企業原始資料進行整合、歸類、分析,從而提供了企業決策分析需要的 kpi。

資料庫和資料倉儲從物理設計角度應該是一致的,都是基於傳統的關聯式資料庫理論,而且這兩者有融合的趨勢。 sqlserver,sybase,db2,oracle都是傳統的關聯式資料庫,同時只要經過認真的資料模型設計或者引數設定也可以變成很好的資料倉儲實體;與此同時資料倉儲也在基於自身的特點不斷地進行發展演變,例如 sybaseiq、 terradata就是完全的資料倉儲,用它來設計 oltp系統顯然是存在各種問題的。

olap也逐漸被融合到資料庫和資料倉儲產品中來,例如微軟的 analysis service 和 db2的 olap server,通過自身提供的專用介面可以加快多維資料的轉換處理。當然象 essbase這樣純粹的 olap也是非常優秀的產品,實際上 80%以上的大型 olap都是採用 essbase的。

說到 etl,一般市場上最重要最全面的還是 informatica,但是關聯式資料庫廠商通過自身的吸取和發展得以改進後,仍舊在不斷蠶食這一市場,最常見的是與 sqlserver搭配的 ssis和 oracle的 owb。

報表工具呢,還是原來的幾個專業工具廠商, hyperion, bo, congos, brio,當然**也不菲,如果想用便宜的還是請選用微軟的 reportservice吧。

分類 產品名稱 

描述 資料庫 

sqlserver 

適合 windows 平台 

滿足中小型資料庫和資料倉儲應用 

sybase 

適合 windows 、 unix 平台 

滿足中小型資料庫和資料倉儲應用 

db2 

適合 unix 平台 

滿足大型、超大資料庫和資料倉儲應用 

oracle 

適合 windows 、 unix 平台 

滿足大型、超大資料庫和資料倉儲應用 

資料倉儲 

terradata datawarehouse 

適合 unix 平台 

滿足大型、超大資料倉儲應用 

db2 datawarehouse 

適合 unix 平台 

滿足大型、超大資料倉儲應用 

sybaseiq 

適合 unix 平台 

滿足大型、超大資料倉儲應用 

olap 

ms olap analysis service 

適合 windows 平台 

滿足中小型資料倉儲應用 

hyperion essbase olap server 

適合 unix 平台 

滿足大型、超大資料倉儲應用 

ibm db2 olap server 

適合 unix 平台 

滿足大型、超大資料倉儲應用 

sas olap server 

未知 etl 

informatica 

適合 unix 、 windows 平台 

專業、全面的、強大的 etl 工具 

oracle warehouse builder 

適合 unix 、 windows 平台 

對 oracle 比較適用的 etl 工具 

msserver integration serivces 

適合 windows 平台 

對 sqlserver 比較適用的 etl 工具 

bo data integrator 

未知 前端工具 

bo crystal report 

主要適合關係型報表 

提供微 cube 功能滿足 olap 建模需要 

hyperion enterprise 

主要適合關係型、 olap 報表 

依託 essbase 的 olap 功能 

brio performance suite 

未知 microstrategy 

未知 congos 

未知 mssqlserver report service 

主要適合 mssqlserver 平台 

關於資料倉儲 總體工具介紹

資料倉儲專案是以關聯式資料庫為依託,以資料倉儲理論為指導 以 olap為多層次多視角分析,以 etl工具進行資料整合 整合 清洗 載入轉換,以前端工具進行前端報表展現瀏覽,以反覆疊代驗證為生命週期的綜合處理過程。最終目標是為了達到整合企業資訊資訊,把資料轉換成資訊 知識,提供決策支援。資料倉儲不是一...

Hive 資料倉儲工具,特性介紹

一 hive的儲存 hive是基於hadoop分布式檔案系統的,它的資料儲存在hdfs中。hive本身是沒有專門的資料儲存格式,也沒有為資料建立索引,只需要在建立表的時候告訴hive資料中的列分隔符和行分隔符,hive就可以解析資料。所以往hive表裡面匯入資料只是簡單的將資料移動到表所在的目錄中。...

資料倉儲介紹

什麼是數倉 資料倉儲簡稱dw,就是乙個用以更好地支援企業或組織的決策分析處理的 面向主題的 整合的 不可更新的 隨時間不斷變化的資料集合。為什麼要有數倉 主要因為面向應用型的應用的資料庫設計一般是操作型的,而資料分析或者資料探勘都是面向分析型的應用。這兩種應用各有特點和適用的場景,對資料的處理應當分...