資料倉儲的那些事

2021-10-09 22:47:03 字數 874 閱讀 3372

一,定義:

1,資料倉儲是乙個面向主題的,整合的,非易失的,隨時間變化的用來支援管理人員決策的資料集合。

- 面向主題:乙個資料倉儲的設計總是基於主題域去進行設計的,比如說是乙個生產商的主題域就分為產品,訂單,銷售商和材料單等等,那麼資料倉儲就會基於這些主題去進行資料表的分層與分類設計

- 整合的:資料倉儲的資料有可能是多個資料來源傳遞的,這些資料在進入到資料倉儲中之後就進行資料的轉換,格式化,重新排列以及彙總等操作。那麼得到的資料只要是存在於資料倉儲之中,就具有企業的單一的物理映像。資料在進入到資料倉儲中之後,也會有對資料中一些格式進行一致化的操作,比如說是日期格式,性別的表示等

- 非易失性:和操作性資料庫週期性的更新資料不一樣,資料倉儲一般是以批量的方式進行資料的載入和訪問,很少進行資料更新(update)。一般都是寫入多個新的快照記錄

- 隨時間變化。所謂的時變性質的是資料倉儲中的每個資料單元都會在乙個時間範圍內生效,一般都會有生效時間或者是否有效的字段來進行乙個標識

2,資料倉儲的分層設計

一般來說我們會將資料倉儲分層去進行儲存,以方便以後我們業務上的資料倉儲。這邊會介紹兩種資料倉儲的設計方式

(2) 維度建模方式:

1.星型建模:

事實表:維度表=1:n

2.雪花模型:

- 事實表:維度表1級:.....:維度表n級=1:n:....:n

資料倉儲那點事

首先總結下今天被問到的沒有答上來的問題吧 1.mysql和sql的區別 mysql 便宜,安裝使用簡便快捷,開源,針對一些對資料庫有特別要求的應用可以通過修改 來實現定向優化 架構 自由選擇儲存引擎。每個表都是乙個檔案,可以選擇合適的儲存引擎。常見的由innodb myisam 等 有開源版,速度最...

資料倉儲上雲那些事兒

資料倉儲上雲已經不是什麼新鮮概念,這裡簡單聊一聊在這個過程中需要考慮的問題。首先,某些話題不是一兩句能說清楚,所以,這裡我們不聊以下話題 to be or not to be,this is a question.首先上雲肯定是有優勢的,而且是不只技術層面的優勢。也許有人說上雲反而更貴,這也僅僅是計...

資料倉儲 資料倉儲部署

1 首先用下面的語句查詢是否有要建立的表空間 hospdw tab 和 hospdw idx 如果沒有,則把d database zyhip改為對應的路徑,有的話直接建立使用者 select tablespace name,file name,round bytes 1024 1024 0 size...