r語言descstats R語言方法總結

2021-10-12 13:06:18 字數 985 閱讀 5935

計算描述性統計量:

1、summary():

例:summary(mtcars[vars])

summary()函式提供了最小值、最大值、四分位數和數值型變數的均值,以及因子向量和邏輯型向量的頻數統計。

計算所選擇的任意描述性統計量。mean、sd、var、min、max、median、length、range 和quantile。函式fivenum()可返回圖基五數總括(tukey』s five-number summary,即最小值、下四分位數、中位數、上四分位數和最大值)。

例:mystats

if (na.omit)xm

nsskew

kurt

return(c(n = n, mean = m, stdev = s, skew = skew, kurtosis = kurt))

3、describe():

hmisc包:返回變數和觀測的數量、缺失值和唯一值的數目、平均值、

分位數,以及五個最大的值和五個最小的值。

例:library(hmisc)

describe(mtcars[vars])

4、stat.desc():pastecs包

若basic=true(預設值),則計算其中所有值、空值、缺失值的數量,以及最小值、最大值、值域,還有總和。

若desc=true(同樣也是預設值),則計算中位數、平均數、平均數的標準誤、平均數置信度為95%的置信區間、方差、標準差以及變異係數。

若norm=true(不是預設的),則返回正態分佈統計量,包括偏度和峰度(以及它們的統計顯著程度)和shapiro–wilk正態檢驗結果。這裡使用了p值來計算平均數的置信區間(預設置信度為0.95:

例:library(pastecs)

stat.desc(mtcars[vars])

5、describe():psych包

計算非缺失值的數量、平均數、標準差、中位數、截尾均值、絕對中位差、最小值、最大值、值域、偏度、峰度和平均值的標準誤

r語言electricity資料集 R語言 資料集

第二章 建立資料集 1.r語言的資料型別 數值型 字元型 邏輯型 複數型 虛數 和原生型 位元組 2.資料結構 a.向量 儲存數值型 字元型和邏輯型資料的一維陣列 a c 1,2,3,4,5 建立 組合功能的函式c a 1 1 2 3 4 5 a c 1,4 訪問 方括號 向量中指定的元素 1 1 ...

r語言mfrow全程 R語言程式

相信很多都對前面我說的r語言感興趣吧,分享一下我的資料吧。這是關於驗證中心極限定理的r程式!驗證 無論隨機變數原來服從哪種分布,只要樣本容量足夠大,其均數都會服從正態分佈 1.正態分佈 ax axwindows 1280,720 par mfrow c 2,2 plot density a a ma...

r語言which R語言向量

向量是以一維陣列的方法管理資料的一種物件型別。可以說向量是r語言中最基本的資料型別,很多演算法函式都是以向量的形式輸入的。向量可以是數值型 字元型 邏輯值型 t f 和複數型。seq產生等距間隔的數列,其基本形式為 seq from 1,to 1,by from to length.out 1 le...