最佳實踐 數倉中的表型別

2021-10-09 16:23:45 字數 703 閱讀 3817

在維度建模中,表型別分為事實表、維度表,而事實表又可以細分為事務事實表、週期快照事實表、累積快照事實表。

事實表

事實表儲存的資料一般是指乙個現實存在的業務物件,比如使用者,商品,商家,銷售員等等,屬於查詢結果中的核心資料。

維度表

維度表一般是指對應一些業務狀態,**的解釋表。也可以稱之為碼表。在查詢過程中,對資料起到篩選、組織作用。通常使用維度對事實表中的資料進行統計、聚合運算。如訂單狀態表,商品分類表,在查詢時可以通過訂單狀態或者商品分類來篩選資料,也可以通過這兩個維度對資料進行聚合運算。

事務事實表

事務事實表是事實表的一種。它的資料特點是,隨著業務不斷產生,而且一旦產生不會再變化,如交易流水、操作日誌、出庫入庫記錄。

對事實事實表的操作只存在插入,而不存在修改。

週期快照事實表

PyODPS開發中的最佳實踐

摘要 pyodps支援用 python 來對 maxcompute 物件進行操作,它提供了 dataframe api 來用類似 pandas 的介面進行大規模資料分析以及預處理,並且可以用 ml 模組來執行機器學習演算法。pyodps 支援用 python 來對 maxcompute 物件進行操作...

PyODPS開發中的最佳實踐

pyodps 支援用 python 來對 maxcompute 物件進行操作,它提供了 dataframe api 來用類似 pandas 的介面進行大規模資料分析以及預處理,並且可以用 ml 模組來執行機器學習演算法。現在為了讓大家能更好地使用 pyodps,我們總結開發過程中的最佳實踐,來讓大家...

數倉分層和維度建模及表的簡述

1.ods層 原始資料層,存放原始資料,直接載入原始日誌 資料,資料保持原貌不做處理,起到備份資料的作用。資料採用lzo壓縮,並建立索引減少磁碟儲存空間 切片 建立分割槽表,防止後續全表掃瞄。可以通過建立外部表供多人使用,內部表 僅供自己使用 2.dwd層 明細資料層,對ods層資料進行清洗 去空值...