資料的探索性分析及R實現

2021-08-20 02:46:50 字數 899 閱讀 4283

一.讀入資料

city=read.csv("2015city.csv")

二.描述性統計
data.outline=function(x)

## input ###################

## x = a vector ############

## output ##################

## the outline of data x ###

三.列聯表
library

(vcd)

table(a) #用table()函式生成簡單的頻數統計表#

prop.table(a) #用prop.table()函式將這些頻數轉化為比例值#

able(a,b) 

xtabs(~a+b,data=mydata) #其中a是行變數,b是列變數#

margin.table(table3,1) #按行#

margin.table(table3,2) #按列#

prop.table(table3) #整個表#

prop.table(table3,1) #按行#

prop.table(table3,2) #按列#

addmargins(table3)

addmargins(prop.table(table3))

library(vcd)

library(gmodels)

crosstable(mydata$a,mydata$b) #a為行變數,b為列變數#

資料的探索性分析

1.簡單統計量分析 極差,最大值,最小值 2.3 原則 如果資料服從正態分佈,在3 原則下,異常值被定義為一組測定值中與平均值的偏差超過3倍標準差的值。如果資料不服從正態分佈,也可以用標準差作為 來進行倍數描述 3.箱型圖分析 在箱型圖中,異常值被定義為小於ql 1.5iqr或大於qu 1.5iqr...

EDA 探索性資料分析

引導資料科學從業者進行資料處理以及特徵工程的步驟,使資料集的結構和特徵集讓接下來的 問題更加可靠。值得注意的是,eda過程中是對原始資料的特徵 統計特徵 分布特徵 相關性等 進行挖掘,但是沒有刪除或構造任何特徵 花式查詢,不包括增 刪 改 1 載入各種資料科學以及視覺化庫 資料科學庫 pandas ...

EDA(探索性資料分析)

1 什麼是eda分析?exploratory data analysis 在特徵 資料處理的過程中,對資料進行探索,找到他們之間的更多潛在關係。2 怎麼去做eda分析?主要是通過資料視覺化來顯示資料之間的關聯,從而對資料進行處理。首先,我們應該思考的是是否會出現下列問題 1 資料是否缺失,有沒有離群...