資料倉儲整合各系統碼表和參數列

2021-10-09 06:28:09 字數 1110 閱讀 8106

在建立資料倉儲時,需要調研涉及到各個源系統,根據各源系統的碼值,可分為如下幾種型別,針對不同型別的**做整合。

通用類**

通用**,包含有行政區劃、幣種、行業分類、國別與地區等。

gb/t 2260-2007 中華人民共和國行政區劃**

gb/t 2659-2000 世界各國和地區名稱**

gb/t 4754-2017 國民經濟行業分類

gb/t 12406-2008 表示貨幣和資金的**

手工錄入**

各個系統中**表中不存在的字典碼值,也不是標準類的**,比如一些標誌、是否、或者記錄在表注釋中的**值,比如comment 0 未確定、1 確定;0 未審核 1 審核通過 2 審核不通過等,需要手工維護到資料倉儲碼表中(總之就是系統不存在的、或難以取得的、手工維護更加方便的,且還需要關聯使用的)。

直接載入使用

各個系統碼值直接載入過來並使用,**值無需轉換。通常是某個系統使用而其他系統不會使用。在進入倉庫時,需要按照倉庫的規則修改下表的名稱。

轉換載入使用

各個系統碼值直接載入無法使用,需要做轉換合併處理,比如證件型別,客戶型別,機構型別等。

比如a系統有證件型別1,2,3,4 分別** 身份證,戶口本,臨時身份證,其他。

而b系統又證件型別為:01,02,03,04,05,06,身份證,戶口簿,警官證,士兵證,臨時身份證,其他證件。

而又性別 f/m、0/1、1/2分別代表不同系統的男女。而資料倉儲需要做**的整合統一。

應優先採用國際標準、國家標準、企業行業資料標準進行編碼 gb(可以參考國家標準)。

應優先使用數字進行編碼0、1、2。

**編碼應該不重複,不遺漏,不存在歧義。

對於有**層級的編碼,建議在編號中進行體現 001001…。

沒有層級的編碼可以採用自然增長的序列1、2、3、4…。

對於標誌類**可採取0、1的方式進行編碼。

建立**維護制度體系,規範流程。

使用文件記錄全部的**資訊以及維護記錄。

使用工具指令碼進行**檢查(對於重複**、新增**等做檢查)。

未完待續.

資料倉儲EDW層資料整合整合的思考

資料倉儲edw層資料整合整合的思考 比爾 門恩 bill inmon 給出了資料倉儲這樣乙個定義,資料倉儲是在企業管理和決策中面向主題的 整合的 與時間相關的 不可修改的資料集合。今天單就資料倉儲的整合整合特性進行思考,我想資料倉儲的整合性大致主要體現在如下幾個方面。1 將企業相關it系統經過面向主...

業務系統和資料倉儲

業務系統和資料倉儲 資料倉儲和業務系統的目的從根本上是不同的。業務系統支援業務處理的執行,同時資料倉儲支援處理的評估。他們的使用目的不同,因此需要不同的原理指導不同的設計。維度建模的原理非常適合資料倉儲系統的需求。業務系統 業務系統 業務系統直接支援業務處理的執行。通過捕獲交易事務重要事件的細節,建...

資料倉儲與企業應用整合(二)

三 cif的案例 sapbw 主要特點是erp 商提供了整個體系結構,這就節省了大量的工作,並且降低了設計和開發的成本,將業務封裝在bw中,降低了長期維護的難度。erp的資料資源是非常豐富和寶貴的,應該是 資料倉儲的重要 sap的bw就是將 資料倉儲納入了erp應用。1.sapbw概述 a.sapb...