如何衡量資料質量

2021-05-24 23:38:54 字數 445 閱讀 6395

資料分析的可靠性的乙個最基本的前提是資料的質量要***,那我們如何衡量資料的質量呢?主要從以下四個方面:準確性,一致性,完整性和及時性。

1、準確性

就是要反映事實情況,比方說使用者的生日是xx,如果說這個資料是準確的,那就得保證這個使用者的生日就是xx。資料的準確性是第一位的,而往往要保證資料準確需要不同程度的代價,需要什麼程度的準確度需要和資料的重要性進行權衡。

2、一致性

客戶是什麼?有人會認為這個問題很好回答,但是在很多的組織中,不同的部門有不同的,通常是相衝突的回答。我們需要定義資料名稱的含義,確保每個人的理解是一致的。

3、完整性

不完整的資料和錯誤的資料一樣有問題,我們需要的字段都有了嗎?我們需要的時間範圍都滿足了嗎?不同產品的資料都有了嗎?每個使用者的資料都有了嗎?

4、及時性

就是要保證資料是最新的,而不是在更新之前的。

**:

如何評估資料質量?

資料質量評估 在做了近乙個多月的資料質量評估方案工作,基本實現了從產出原始資料 資料清洗 入庫有效資料等階段,從對質量沒有任何概念到實現基本的指標展示,也算是從設計到 到展示的流程跑通,在一定程度已經能體現公司目前的資料質量 1.為什麼做資料質量?公司資料是從excel挖掘出來的,不確定性與未知性,...

衡量軟體測試質量的常用的質量度量指標

衡量軟體測試質量的常用度量指標 指標名稱 定義度量範圍 工作量偏差 實際工作量 計畫工作量 計畫工作量 100 進度測試執行率 實際執行的測試用例數 測試用例總數 100 測試進度 測試通過率 執行通過的測試用例數 測試用例總數 100 開發質量 需求 測試用例 覆蓋率 已設計測試用例的需求數 需求...

如何衡量測試效率

以系統測試發現缺陷的數量來衡量測試人員的系統測試效率,就好像拿開發人員的 行數衡量開發人員的開發效率一樣,無法客觀有效的反映測試人員的工作質量和工作效率。優點 以bug數量為基礎,有乙個明確而清晰的度量標準 缺點 欠缺力度和有效尺度,不能真正反映當前系統的質量狀況 原因 1 乙個點型的例子,主業務流...