02 資料分析 資料指標與質量

2021-10-05 06:16:27 字數 485 閱讀 6574

根據資料統計或資料分析得到的反映或評價某一事件的資料

指標的屬性:

業務屬性 —— 名稱、計算邏輯、描述物件、時效和查詢許可權等

技術屬性 —— 系統**、取數字段、取數頻率、加工規則

1. 按照統計方式分

基礎指標: 是描述物件的直接統計結果,未經過轉化的資料,如交易筆數、交易金額、交易使用者數

復合指標: 建立在基礎指標之上,通過一定的運算規則形成的反映事件結果的資料,如合格率、完成率、利潤

2. 按照描述內容

數量指標: 反映事件的規模、數量、統計結果等

質量指標: 反映事件的質量、強度、經營管理的質量、經營效果等的資料,如合格率、完成率、利潤率等

缺失值:資料集中的某個欄位或幾個字段缺失

重複值:應該唯一的物件出現重複

異常值:不同於其他大部分資料物件特徵的資料,(箱型圖、正態分佈 找出異常值)

準確率:資料描述結果與實際有偏差

資料分析指標與資料驅動

資料誤區 web重要指標 移動應用的指標 電商類產品指標 轉化率分析 漏斗分析。注意 轉化率需要對比競品,同行均值,上月。ugc使用者生成類的指標 獲取指標方式 程式設計師記錄日誌 分析師 產品經理給出計算邏輯 程式設計師計算指標 分析工具 自定義事件分析功能使用率 利用轉化漏斗分析流程與參與深度 ...

資料分析與挖掘筆記(二) 資料質量分析

作用 資料預處理的前提,也是資料挖分析結論有效性和準確性的基礎。主要任務 檢查原始資料中是否存在髒資料 不符合要求,以及不能直接進行相應分析的資料。如缺失值 異常值 不一致的值 重複資料及含有特殊符號的資料 一 缺失值分析 產生原因 缺失值 影響 缺失值的分析 缺失值的處理 二 異常值分析 異常值是...

大資料分析如何保證資料質量

平時企業都會處理資料質量的問題,越來越能夠懂得資料庫整套系統的執行模式和模型概念,深深覺得資料探勘的本質其實不僅僅是從海量的資料中發現有效的,有用的,有目的性的資料,深入來說,如果大資料平台裡的資料質量根本無法保證,那麼資料探勘就是毫無意義的,命中率和精確度根本沒有參考價值。但是問題就出在這裡,外圍...