R語言檢測資料正態分佈

2021-06-21 12:53:09 字數 1067 閱讀 7575

輸入注釋

nx <- c(rnorm(10))

隨機產生10個正態分佈的資料

nx檢視nx

[1] -0.83241783 -0.29609562 -0.06736888  -0.02366562 0.23652392  0.97570959

[7] -0.85301145  1.51769488 -0.84866517  0.20691119

檢視的結果

shapiro.test(nx)

shapiro-wilk方法進行正態檢驗

shapiro-wilk normality test

data:   nx

w = 0.9084, p-value = 0.2699

檢驗結果,因為

w接近1 p值大於0.05,所以資料為正態分佈,和origin 統計的結果一致(下圖)

例項二   r語言自帶的正態性檢測(kolmogorov-smirnov方法)

輸入注釋

nx <- c(rnorm(10))

隨機產生10個正態分佈的資料

nx檢視nx

[1] -0.83241783 -0.29609562 -0.06736888  -0.02366562 0.23652392  0.97570959

[7] -0.85301145  1.51769488 -0.84866517  0.20691119

檢視的結果

ks.test(nx, "pnorm", mean = mean(nx), sd =  sqrt(var(nx)))

shapiro-wilk方法進行正態檢驗

kolmogorov-smirnov檢驗需要三個輸入變數,及資料本身、均值及標準差

one-sample kolmogorov-smirnov test

data:   nx

d = 0.1828, p-value = 0.8344

alternative hypothesis: two-sided

檢驗結果,因為

p值大於0.05,所以資料為正態分佈,和origin 統計的結果一致

正態分佈R語言例項

開機時顯示的時間排名是如何設計的呢?下面以此為例一起學下r語言與正態分佈。首先,你可能會覺得它是這樣子實現的 1 收集所有使用者的開機時間的資料,排好序放在乙個資料庫中 2 然後根據你的開機時間,找出你的排名,除以總使用者數,就是你擊敗電腦佔比。data mean data 1 sd data 1 ...

R正態分佈 ggplot

randnorm rnorm 3000 rnorm 3000 產生3000個正太分布數 randdensity dnorm randnorm dnorm randnorm 求其密度函式值 ggplot data.frame x randnorm,y randdensity aes x x,y y g...

2 2正態分佈檢測

encoding utf 8 import sys import numpy as np import pandas as pd from scipy import stats as sts import matplotlib.pyplot as plt import matplotlib as m...