4分鐘帶你看懂究竟什麼是資料倉儲?

2021-10-07 19:50:21 字數 1309 閱讀 6314

資料倉儲是商業和資料科學中最熱門的話題之一。

但是,如果你是該領域的新手,你可能想知道什麼是資料倉儲?為什麼我們需要它,它是怎麼執行的?

別擔心,因為在接下來的4分鐘,你將知曉這所有問題的答案。

cda資料分析師 出品

編譯:mika

資料倉儲是商業和資料科學中最熱門的話題之一。

但是,如果你是該領域的新手,你可能想知道什麼是資料倉儲?為什麼我們需要它,它是怎麼執行的?

別擔心,因為在接下來的4分鐘,你將知曉這所有問題的答案。

好的,首先讓我們看到定義。

唯一資料來源——這個詞是什麼意思?

在資訊系統理論中,唯一資料來源是在乙個地方構造全部最佳質量資料的實踐。

讓我們看到乙個簡單的例子:

你肯定遇到過這種情況,當你在處理檔案,並且建立不同的版本,這時你怎麼給檔案命名?

當你完成後,你通常會在結尾加上「最終版」。

這導致產生一堆帶有副檔名的檔案:

最終版,最終的最終版,最終的最終的最終版…

或者是我的最愛,真正最終版…的最終版。

如果你是這樣,恭喜你,你不是乙個人。

有時候,即使是公司,也都不知道最新或最合適的檔案在**。

但是如果你知道有個地方會始終存放著唯一的資料來源,那就太棒了,不是麼?

資料倉儲就可以滿足這種需求,那到底什麼是資料倉儲呢?

其實就是公司儲存其寶貴資料資產的地方。包括客戶資料、銷售資料、員工資料等。

簡而言之,資料倉儲是公司事實上的唯一資料來源。

通常建立它是為了將其主要用於資料報告和分析目的。

資料倉儲有幾個定義特徵:

物件導向性

整合性時變性

永久性歸納性

讓我們快速地分別看看。

01 物件導向性

這意味著資料倉儲中的資訊會圍繞某些方面。

因此,它永遠不會包含所有公司資料,不過只會包含相關的主題。

例如,競爭對手的資料不需要出現在資料倉儲中。但是,自己的銷售資料肯定會在。

02 整合性

這就是為什麼要開發通用標準,以確保資料倉儲在任何方面都能選擇最佳質量的資料。這與主資料治理有關,但這是另乙個話題了。

03 時變性

資料倉儲也包含歷史資料。如前所述,我們主要使用資料倉儲進行分析和報告。這意味著我們需要知道五到十年前發生的事情。

04 永久性

意味著資料僅按原樣錄入資料倉儲,一旦存入,就無法更改或刪除。

05 歸納性

再次觸及將資料用於資料分析這一事實。通常,它會以某種方式進行彙總或細分,為了便於分析和報告。

好的,這就是資料倉儲,是對於公司而言結構優良,永久性事實上的單一資料來源。

10分鐘帶你看懂氣泡排序Yu選擇排序

你可以這樣理解 從小到大排序 存在10個不同大小的氣泡,由底至上地把較少的氣泡逐步地向上公升,這樣經過遍歷一次後,最小的氣泡就會被上公升到頂 下標為0 然後再從底至上地這樣公升,迴圈直至十個氣泡大小有序。在氣泡排序中,最重要的思想是兩兩比較,將兩者較少的公升上去 問題 設有一陣列,其大小為10個元素...

三分鐘帶你看懂prototype原型 ES6高階

1.prototype 定義 在js中的類的實現是基於prototype的,基於原型的繼承比基於類的繼承在概念上更為簡單 乙個新物件可以繼承乙個舊物件的屬性 2.new 建構函式 很短很簡單,要看完嗷 function star uname,age var ldh newstar 劉德華 18 va...

帶你一分鐘看懂企業直播特性

直播直至今日依然火爆如初,直播 讓很多行業趨之若鶩,當然現在已經有不少行業嵌入了直播服務和技術,那麼對於企業來說,直播是一種全新的營銷工具,利用它的特性就能夠有很好的營銷效果,那麼企業是怎麼結合直播特性來營銷的呢?1 實時性 說到實時,我們都能夠想到當前的熱點突發事件,如前不久的美國 選舉。隨著5g...