資料倉儲建設持續改進資料質量

2021-05-28 00:43:44 字數 2141 閱讀 2717

從實施中國電信6省營銷分析情況來看,資料質量改進普遍存在如何定義資料質量評價標準、如何實現資料質量管理的閉環過程、如何界定資料質量改進過程中各系統間的功能邊界三個難點問題。

資料質量改進案例分析

從實施中國電信6省營銷分析情況來看,資料質量改進普遍存在如何定義資料質量評價標準、如何實現資料質量管理的閉環過程、如何界定資料質量改進過程中各系統間的功能邊界三個難點問題。

如何定義資料質量評價標準——首先前端、後端、管控部門根據其專業對資料的不同要求,評價標準各有不同(如後端業務支撐部門對資料的要求是保障其系統的正常執行;前端業務部門對資料的要求是真實反映市場情況;管控部門要求資料要和財務報表保持一致)。資料倉儲建設也要結合實際情況,合理制定各階段資料質量評價標準,以保障系統建設的順利進行。

如何實現資料質量管理的閉環過程——在實際操作中,由於沒有形成資料質量的改進閉環,很容易出現「前清後亂」的情況,這需要制定乙個完善的資料質量管理流程,以實現資料質量的持續改進。

如何界定資料質量改進過程中各系統間的功能邊界——資料質量問題牽涉到提供源資料的生產系統和資料倉儲系統,在質量改進中必然存在由誰來進行改進的問題,界定改進過程中系統間功能邊界也是資料質量管理的難點問題。

針對這三個問題,通常在各省基本採用以下方法加以解決

◎建立由管理層牽頭的資料管理機構,推動資料質量的改進工作

資料質量改進與管理的關係密不可分。在資料質量的管理上,需要建立乙個由省公司主管部門牽頭,相關部門和整合商參與的專案小組負責資料質量標準定義和控制。責任人落實到各個分公司的生產系統業務主管或省公司各生產系統業務主管。如果發現有質量問題向各個本地網分公司進行通報,從而保障了資料質量改進的有效推行。

◎制定可操作的資料質量管理制度

管理部門需要和整合商一起根據實際情況制定可操作的管理制度,主要的管理制度包括,分階段定義的資料質量目標、資料評價辦法、資料管控流程、統一編碼、資料核對規則等。

◎完善的資料質量控制流程是持續改進的基礎

在進行資料質量改進實施過程中,需要根據資料質量問題的特點制定一套資料質量控制流程,為提高資料質量水平起到了關鍵的作用。

◎etl集中監控和元資料管理的技術實現

自行開發了etl集中監控模組和元資料管理功能模組。

在元資料管理中對資料和處理過程做了定義,使用者有了乙個資料倉儲地圖。如果資料來源或者抽取邏輯發生變化,使用者可以分析對其他元資料的影響。

通過etl集中監控模組可以對資料的整體處理流程進行定義;將資料質量評價標準以資料校驗程式化,並作為流程中的乙個環節配置到流程中;使用者可以對處理過程實施監控,對於資料異常能夠及時得到告警資訊和錯誤報告。

通過以上措施,在資料質量上可以取得以下實際效果:

資料整合過程得以規範化,也減輕了維護人員的工作負擔。

各級人員對資料質量變得敏感,如果發現有質量問題向各個本地網分公司進行通報,從領導到具體責任人都關心資料質量問題,提高了相關人員對資料質量的重視程度和工作責任心。

資料質量穩步提高,例如通過對計費、九

七、渠道系統客戶資料的對比、過濾、合併等方法,使得客戶資料逐步趨於完整和一致。

持續改進思路

通過資料清理,將逐漸形成完整和準確的企業資料檢視,為經營分析和生產支撐提供可靠的資料**。

由於資料來源系統會不斷公升級,同時經營分析系統的資料模型也存在優化和發展。資料質量是乙個持續改進、反覆迭代、螺旋上公升的過程。資料質量任重道遠,不可能一勞永逸,要作為長期的任務來抓。

例如在客戶資料的清理上,可以按照「先大客戶,然後商業客戶,再次公眾客戶」,在客戶屬性上「先保證客戶消費屬性,後社會屬性」的思路做清理。對每一種客戶型別也可以劃分成幾個階段:

第一階段 整理客戶、使用者、帳戶三戶模型,通過歸併、篩選、補充等方法在現有生產系統上先建立起統一的客戶標識、帳戶標識、使用者(銷售品例項)標識;建立起客戶與使用者之間的對應關係、客戶與帳戶的對應關係,使用者與帳戶之間的對應關係。

第二階段 整理產品/銷售品,定義新的產品目錄表,按產品/優惠**定義銷售品目錄;將原有產品對映到新定義的產品目錄表中;將新功能對映成附屬產品;並定義出產品與產品例項對應關係、產品例項間的對應關係、產品例項與定價計畫和客戶協議之間的對應關係。

第三階段 補充客戶社會屬性,通過第一階段和第二階段建立起客戶消費屬性,再通過crm系統和css系統補充客戶社會屬性,形成統一的企業客戶檢視。

資料倉儲建設持續改進資料質量(二)

資料質量改進案例分析 從實施中國電信6省營銷分析情況來看,資料質量改進普遍存在如何定義資料質量評價標準 如何實現資料質量管理的閉環過程 如何界定資料質量改進過程中各系統間的功能邊界三個難點問題。如何定義資料質量評價標準 首先前端 後端 管控部門根據其專業對資料的不同要求,評價標準各有不同 如後端業務...

資料倉儲建設 資料建模

首先我們先檢視三個問題 什麼是資料模型 為什麼需要資料模型 如何建立資料模型 一 什麼是資料模型 資料模型是抽象描述現實世界的一種工具和方法,是通過抽象的實體及實體之間聯絡的形式,來表示現實世界中事務的相互關係的一種對映。在這裡,資料模型表現的抽象的實體和實體之間的關係,通過對實體和實體之間關係的定...

如何建設資料倉儲?

資料倉儲作為企業提供決策支援而構建的整合化資料環境,本身並不產生或者消費資料,基本架構包含的是資料流入流出的過程,首先放上一張資料倉儲的架構圖。資料倉儲作為中間整合化資料管理的乙個平台,底層有多種資料 流入資料倉儲之後對上層應用開放。1 分析業務需求,確定資料倉儲主題 資料模型的建立依賴資料倉儲主題...