資料倉儲中資料粒度

2021-06-22 13:35:40 字數 843 閱讀 7055

粒度問題是設計資料倉儲的乙個最重要方面。粒度是指資料倉儲的資料單位中儲存資料的細化或綜合程度的級別。細化程度越高,粒度級就越小;相反,細化程度越低,粒度級就越大。確定粒度是資料倉儲開發者需要面對的乙個重要的設計問題。如果資料倉儲的粒度確定合理,設計和實現中的其餘方面就可以非常順暢地進行;反之,如果粒度確定的不合理就會是其他所有方面都很難進行。粒度對於資料倉儲體系結構設計人員來說,非常重要,因為粒度會影響到那些依賴於從中獲取資料的資料倉儲的所有環境。

粒度的主要問題是使其處於乙個合適的級別,粒度的級別既不能太高也不能太低。低的粒度級別能提供詳盡的資料,但要占用較多的儲存空間和需要較長的查詢時間。高的粒度級別能快速方便的進行查詢,但不能提供過細的資料。在選擇合適粒度級別的過程中,要結合業務的特點,分析的型別、依據的總的儲存空間的等因素綜合考慮。

所謂粒度,指的是資料倉儲中資料單元的細節程度或綜合程度的級別,在資料倉儲中記錄資料或對資料進行綜合時所使用的時間段引數(《資料倉儲和資料探勘》)。它決定了資料倉儲中所儲存的資料單元在時間上的詳細程度和級別。

粒度可分為兩種形式,第一種形式的粒度是對資料倉儲中資料綜合程度高低的乙個度量,它及影響到資料倉儲中資料量的多少,也能影響到資料倉儲所能回答的訊問的種類。粒度越小,則詳細程度越高,綜合程度就越低,回答訊問的種類越多;相反,粒度越大,則向此程度越低,綜合程度越高,回答訊問的種類也就越少。另一種形式的粒度是樣本資料庫粒度,與同城意義下的粒度不同。樣本資料庫粒度界別不是根據綜合層序的不同來劃分的,而是根據取樣率的高低來劃分的。取樣粒度不同的樣本資料庫可以具有相同的綜合級別。樣本資料庫一般是以一定的樣本率從細節檔案資料或輕度綜合資料中抽取的乙個自己。它是根據一定需求從資料來源中獲得乙個樣本,因而也就不能回答一些細節性的問題。樣本資料庫的抽取可以按照資料的重要程度不同來進行。

資料倉儲中資料粒度

粒度問題是設計資料倉儲的乙個最重要方面。粒度是指資料倉儲的資料單位中儲存資料的細化或綜合程度的級別。細化程度越高,粒度級就越小 相反,細化程度越低,粒度級就越大。確定粒度是資料倉儲開發者需要面對的乙個重要的設計問題。如果資料倉儲的粒度確定合理,設計和實現中的其餘方面就可以非常順暢地進行 反之,如果粒...

資料粒度(資料倉儲)

資料倉儲中的粒度是指資料的詳細程度,同樣為了描述乙個情況,我可以用很多的資料,但同樣我也可以只用必需的資料。而這起決於儲存器。如果有很大的硬碟,那就沒有我們不能存的事情。所以,估計一年內裡表中的最大行數和最小行數,是設計者的最大問題。這裡牽扯到了乙個概念 上下限推測的方法。別問我,我也不懂 然後通過...

資料倉儲之資料粒度

粒度的定義 確定資料倉儲中資料的恰當粒度是資料倉儲開發者需要面對的乙個最重要的設計問題。資料粒度主要針對指標資料的計算範圍,如人口這個資料項在統計部門是以街區範圍還是乙個社群為範圍統計的。人口資料細化程度越高,粒度級就越小 相反,細化程度越低,粒度級就越大。粒度是資料倉儲主要設計問題,因為它極大地影...