資料倉儲技術及其演變

2021-07-03 23:40:12 字數 1291 閱讀 4814

速度 可用

資料增長

資料的多樣化

軟硬體技術進步,**降價

dw->dw2.0

變化 總體-dw架構

來自:

來自:dw 2.0 – the architecture for the next generation of data warehouse

挑戰 反向於集中式?

雲是否合適大資料?

結構化資料->半結構化、非結構化資料

批處理->實時

批處理、實時可不可以用一套框架處理?

mpp->nosql

rdbms->專有資料庫

hadoop

缺點 spark

缺點 大資料框架的發展方向

規範 穩定、易用

大一統vs專業化

資料庫的發展方向

資料庫配合使用

混合使用多種儲存介質

壓縮 分割槽

load

bitmap索引

無主外來鍵

不記日誌(弱日誌)

預統計(inforbright knowledge grid)

部分資訊統計後放入系統表,查詢直接走系統表

還有哪些技術可以引入?

etl工具

優點 缺點

演進同資料庫路線類似

etl-資料倉儲

缺點 基於工具或資料倉儲,哪種方式在大資料處理方面佔優勢?

pc->移動

bi工具

優缺點同etl工具

自帶資料集市

專有格式->通用格式

專有伺服器->通用伺服器

我們需要什麼樣的bi?

專有語言->通用語言

我們如何進行資料探勘?

cpu

hdd儲存順序訪問、速度慢;隨機訪問且要求高的用ssd硬碟

hdd儲存順序訪問、速度慢;隨機訪問且要求高的用ssd硬碟;效能要求極高的用記憶體

網路100m->1000m->10g->40g->100g

ETL(資料倉儲技術)

etl,是英文 extract transform load 的縮寫,用來描述將資料從 端經過抽取 extract 轉換 transform 載入 load 至目的端的過程。etl一詞較常用在 資料倉儲,但其物件並不限於資料倉儲。etl是構建資料倉儲的重要一環,使用者從 資料來源抽取出所需的資料,經...

資料倉儲 資料倉儲部署

1 首先用下面的語句查詢是否有要建立的表空間 hospdw tab 和 hospdw idx 如果沒有,則把d database zyhip改為對應的路徑,有的話直接建立使用者 select tablespace name,file name,round bytes 1024 1024 0 size...

資料倉儲(十) OLAP技術

olap伺服器通常採用多維模型 inmon認為多維模型應當用在資料集市上,而資料倉儲應採用關係模型 kimball認為可以直接採用多維模型建立維度資料倉儲。二人均認可多維模型,只是應用場景不同 其具體實現可分為 rolap 關係型聯機分析處理 rolap基本資料和聚合資料均存放在rdbms之中。mo...