Kimball多維模型的四大誤解

2021-10-08 10:13:06 字數 814 閱讀 1959

很久沒看模型方面的理論知識,最近3年在網際網路公司琢磨前行,遇到了很多坑和自我否定或迷惑的狀態。就多維模型來說,被傳統行業洗禮,還有誤人子弟的網上文章和cube工具,把kimball帶入了乙個萬劫不復的誤區。我是幸運的,而且逃離了這個誤區。接下來講解一下我親身經歷的(raph總結的)四大誤區:
原因:完全是被某些cube工具帶偏了對kimball的理解。如kylin, 只能選擇5~10個維度構建cuboid。

事實上,多維模型首先是把某個業務過程,基於最細粒度構建維度化模型。網際網路數倉常用的大寬表,一般採用這個方式構建維度公共層模型。

怎麼能說它只包含彙總資料呢?

原因:很多專案採用inmon構架基礎資料層,然後構建多維資料集市。導致很多碼農以為,維度模型僅僅適用於某個部門的產品需求。

事實上,多維模型是圍繞企業匯流排架構和價值鏈的業務過程來構建,構建星型或雪花型維度化模型。比如匯流排矩陣,主題寬表層,就是面向企業級。

原因:維度模型只能裝有限少量維度的彙總資料,一旦迭代維度,模型就需要重構和預計算資料。

事實上,給終端使用者報表的彙總資料,屬於聚集事實表,這很不容易擴充套件。聚集事實表,衍生於最細粒度構建的維度模型。如果說模型不可擴充套件,或資料量必須有限,那就是設計者的建模理論缺乏導致。

原因:很多演算法工程師,總是基於彙總的資料做模型演練和機器學習。一旦迭代,他們就得重新去取數,構建資料集。

事實上,構建最細粒度的、高內聚低耦合的維度模型,非常容易擴充套件,並且主動擁抱迭代。

希望此文,對迷途中的你有所幫助。

OpenCL 1 程式設計四大模型介紹

本節介紹opencl的四個程式設計模型。opencl作為開放性的異構計算的標準,支援的平台有cpu gpu dsp fpga。支援的裝置如此不同,那麼需要對它們有乙個統一的分層 模型劃分,才能讓各家更好的實現 平台模型 執行模型 記憶體模型 程式設計模型。opencl裝置內部由多個計算單元 cu 組...

雲計算的四大好處和四大疑慮

究竟雲計算多麼重要?它是一次翻天覆地的變革 是計算能力生產與消費方式上一次意義深遠的變革。就像乙個世紀以前,製造業從蒸汽到電力的轉變一樣,既不可避免,也不可扭轉。而且,正如當初那場轉變給工廠業主們帶來了眾多好處並開啟新的機會之門一樣,雲計算也會給使用者帶來許多優勢。cio作為企業的決策者之一,必須重...

使用CSS框架的四大優點四大不足

使用css框架的四大優點四大不足 css框架是乙個軟體,它為你的html開發提供了許多選項以供使用,可能使得你開發 或web程式更快速更簡單。css框架通過包括預定義 庫來達到這個目的。乙個例子是基於網格的框架,它建立了乙個預定義寬度的多列布局所以你可以專注於建立內容而不是排列文字塊。但是使用css...