資料倉儲學習(2)

2021-06-29 14:15:19 字數 1361 閱讀 7347

這次主要回答以下幾個問題

這次的內容會參考書籍《資料倉儲》第四版,william h. inmon中文翻譯版

1. 什麼是資料倉儲

資料倉儲是一種面向主題的,整合的,相對穩定的,反映歷史變化的資料集合,用於支援管理決策。

資料倉儲是為企業所有級別的決策制定過程提供的所有型別資料的戰略集合。為企業提供需要業務智慧型來指導業務流程改進和監視時間、成本、質量和控制。

資料倉儲是根據源自操作型環境中的應用資料建立起來的。把這些資料轉到資料倉儲時要進行整合。

資料倉儲是一種體系結構而不是一種技術

2. 為什麼要用資料倉儲

"為什麼所有這些資料要積累起來?真有人用這些資料嗎?

2.1 正是有了資料倉儲,獲取資訊的代價在急劇的降低。分析使用資料倉儲的原因,很重要的一點就是從成本的角度來分析,因為公司使用資料倉儲的意義是為了賺錢,如果不能產生利潤或者節約成本,那麼為什麼要用資料倉儲呢。

從成本上來說呢,有兩種,一種是巨集觀上來說的,一種是從微觀上說的

巨集觀上說,自從我們建立了資料倉儲之後,我們的股價漲了多少多少,但是有乙個問題,股價的**可能是多種原因,可能資料倉儲只是其中一種而已

微觀上講,同樣的兩家公司,每家公司都有類似的業務需求和資料分布,唯一不同的是,其中一家公司是有資料倉儲的,在正常的情況下,沒有資料倉儲的公司想要分析歷史資料的話,

需要經歷以下流程:

找到歷史資料

傳遞傳統資料技術:老的技術

整合資料:多資料來源整合,資料定義的校正

籌備資料:籌備儲存區

建立報告

而有資料倉儲的呢,只需要從資料倉儲中查詢資料就可以了,時間短,成本低。但是如果是算成本的話,還需要考慮建立資料倉儲的成本

建立資料倉儲的過程

找到遺留資料

通過遺留環境傳輸

整合資料

籌備資料

這個過程和乙個查詢很類似,如果僅僅只有一次查詢,兩者的成本類似,但是當部門多起來,需要查詢的東西多起來的時候,每次沒有資料倉儲的都需要做這樣一件事情,成本增長很快的,而資料倉儲的話,可以極大的縮減成本。

3. 怎麼建立資料倉儲

資料倉儲是在一種螺旋式開發方法學的指導下開發的。與傳統的系統開發是不一樣的,在傳統的瀑布模型下,首先分析需求,之後設計和開發,之後測試。而建立資料倉儲是完全相反的,首先是由資料開始的,得到資料後,對資料進行整合,然後檢驗資料存在什麼偏差。之後針對資料寫程式,分析程式的執行金結果,之後,系統的需求才能被理解。

4. 如何使用資料倉儲

首先,談談資料倉儲的使用頻率問題,基本上是一種二元的模式,要不利用全部硬體,要麼根本不用硬體。這樣的話,雲計算平台就有了作用,當需要時,向雲平台租借計算能力,這個要付錢的,當不需要的時候,就不用付錢,像用電一樣使用計算能力和儲存能力,科技的發展真的很快。

資料倉儲學習

3.資料倉儲的設計始於資料模型。企業資料模型用於操作型環境的設計。企業資料模型的 一種變型用於資料倉儲的設計。資料倉儲以反覆開發的形式建立。對於資料倉儲的需求是不 可能預先知道的。資料倉儲的構造是在與傳統操作型系統完全不同的開發生命週期中進行的。資料倉儲開發者面臨的基本問題是管理大量資料。為此,資料...

資料倉儲學習

資料倉儲 第二章 資料倉儲環境 1 1.1資料倉儲的特性介紹 資料倉儲是乙個面向主題的,整合的,非易失的,隨時間變化的用來支援管理人員決策的資料集合。面向主題 對於乙個保險公司,公司的主題域可能是顧客 保險單 保險費 與索賠。而對於乙個生產商,主題域可能是產品 訂單 銷售商 材料單與原貨物等。不同型...

資料倉儲 資料倉儲部署

1 首先用下面的語句查詢是否有要建立的表空間 hospdw tab 和 hospdw idx 如果沒有,則把d database zyhip改為對應的路徑,有的話直接建立使用者 select tablespace name,file name,round bytes 1024 1024 0 size...