怎麼做資料的EDA分析?

2021-09-23 17:21:04 字數 675 閱讀 6395

探索性資料分析

(exploratory data analysis,簡稱eda)

我的理解是,所謂「探索」,就是自己不受規則約束、用各種方法去找資料的特點、規律。

首先要敢於假設,不設限。拿到一堆資料後,多少會有點猜想,那麼就可以去大膽嘗試和驗證;

怎麼驗證猜想乃至挖掘出更多關係與規律呢?要多做圖,通過將資料視覺化來直觀淺顯地展示其中的資料關聯。

單變數分析

基本統計量(中位數、四分位數、偏度、峰度等等) 

偏度、峰度:資料的大致分布情況,功能上與直方圖類似,其雖然可量化,但不如直方圖直觀 

直方圖

- 對稱? 

- 分散? 

- 異常值? 

- 有間隙? 

箱線圖

- 異常值? 

- 對稱? 

- 比較幾批資料的形狀 

正態性檢驗

- 圖示法

- 直方圖鐘型? 

- 箱線圖 

- qq圖 

- 非引數檢驗方法

兩個變數的分析報表

怎麼做需求分析

如果將需求分析階段的工作歸結為編寫需求規格說明書,這種簡化的做法往往是導致專案後期層出不窮問題的罪魁禍首。建議採用以下步驟形成軟體需求 獲取使用者需求 分析使用者需求 編寫需求文件 評審需求文件 管理需求。下面我們先來討論前兩個步驟 獲取使用者需求 分析使用者需求 的做法。獲取使用者需求 這是該階段...

怎麼做需求分析

乙個成功專案的關鍵在於需求做的怎麼樣!做專案需求可以是對涉及的各個部門人員分別做調查,相對來講,這樣做的需求分析,才更能體現實際,切實了解到客戶基層遇到哪些困難 需要解決哪些問題 以及操作的整個流程,但,並不是每個部門的每個人員都願意配合工作 專案成功可能會導致某些人丟職位 也可以是只對相關領導和關...

效能測試分析怎麼做

效能測試旨在確定系統的效能以衡量效能問題,驗證系統的效能質量屬性,例如在各種負載條件下的響應性,速度,可伸縮性,穩定性.在混合負載條件下對系統進行了測試,並檢查了系統在各種工作負載下響應所需的時間。軟體效能測試涉及對被測應用程式的測試,以確保應用程式在各種負載條件下都能按預期工作。效能測試的目標不僅...