資料分析基本步驟

2021-10-06 23:24:13 字數 600 閱讀 8370

異常值處理

* 檢測:使用基於統計、距離、密度的方法進行異常值檢測

* 處理:刪除異常值或使用魯棒性強的模型

資料轉換

* 常見的檔案格式與格式轉換—json、csv、excel

* 資料操作—資料切片 、資料去重、資料複製

* 資料離散化—等距離散化、等頻離散化、聚類離散化

* 資料標準化—z-score標準化、logestic標準化、min-max標準化、正態化檢驗、box-cox變換

基於資料庫的清洗

* sql語句—insert、delete、update

* mysql語句與函式—create、drop、where、orderby、join、null…

機器學習

關聯分析文字分析社交網路分析

第一次試著寫markdown文件

內容正在完善中

可能會有不準確,內容僅供參考

資料分析的基本分類 分析步驟及分析模型

資料分析的含義 通過恰當的統計方法和可行的分析手段,首先對資料進行收集彙總,其次加工處理,最後對處理過的有效資料進行分析,從而發現問題,找到可行方案,得到有效的決策,幫助分析者採取更科學的行動。一切可分析的資訊都是資料,包括文字,圖形,行為方式。資料分析的分類 描述性統計分析 概括 表述事件關係 探...

資料分析資料探勘的步驟

資料探勘主要包括以下幾個步驟 目的 清楚挖掘的目的是什麼?想要達到的目的是什麼?目的 抽取與挖掘目的相關的資料集 目的 保證資料的質量,為模型質量打下基礎 可以從資料質量分析和資料特徵分析兩個角度對資料進行探索 目的 資料質量分析的主要任務是檢查原始資料中是否存在髒資料 資料質量分析要求我們拿到資料...

資料分析的步驟有哪些?

資料分析 有極廣泛的應用範圍,這是乙個掃盲貼。典型的資料分析 可能包含以下三個步 資料分析過程實施 資料分析過程的主要活動由識別資訊需求 收集資料 分析資料 評價並改進資料分析的有效性組成。一 識別資訊需求 識別資訊需求是確保資料分析過程有效性的首要條件,可以為收集資料 分析資料提供清晰的目標。識別...