R語言 資料處理的常用函式

2021-10-23 04:43:17 字數 3569 閱讀 9252

在r語言中,有許多可應用於數值計算和統計分析的數值函式,主要可以分成數學函式,統計函式和概率函式三大類。函式

描述abs(x)

絕對值sqrt(x)

平方根ceiling(x)

不小於x的最小整數

floor(x)

不大於x的最大整數

trunc(x)

向0的方向擷取x中的整數部分

round(x,digits=n)

將x捨入為指定位的小數

signif(x,digits=n)

將x捨入為指定的有效數字位數

sin(x)、cos(x)、tan(x)

正弦、余弦和正切

asin(x)、acos(x)、atan(x)

反正弦、反余弦和反正切

exp(x)

指數函式

log(x,base=n)

對x取以n為底的對數

示例:

abs(-10)   #  對10取絕對值

# 執行結果:

# [1] 10

sqrt(16)

# 執行結果:

# [1] 4

ceiling(3.457)

# 執行結果:

# [1] 4

floor(3.457)

# 執行結果:

# [1] 3

trunc(5.99)

# 執行結果:

# [1] 5

trunc(-5.99)

# 執行結果:

# [1] -5

round(3.457,digits = 2)

# 執行結果:

# [1] 3.46

signif(3.457,digits = 2)

# 執行結果:

# [1] 3.5

cos(2)

# 執行結果:

# [1] -0.4161468

log(10,base=10) # 對10取以10為底的對數

# 執行結果:

# [1] 1

log(10) # 對10取以e為底的對數

# 執行結果:

# [1] 2.302585

log10(10) # 對10取以10為底的對數

# 執行結果:

# [1] 1

exp(2.302585)

# 執行結果:

# [1] 9.999999

函式

描述mean(x)

平均數median(x)

中位數sd(x)

標準差var(x)

方差quantile(x,probs)

求分位數。其中x為待求分位數的數值型向量,probs為乙個由[0, 1]之間的概率值組成的數值向量

range(x)

求值域sum(x)

求和min(x)

求最小值

max(x)

求最大值

scale(x,center=true,scale=true)

對x按列進行中心化(center=true)或標準化(center=true,scale=true)

diff(x,lag=n)

滯後差分,lag用於指定滯後幾項。預設的lag值為1

difftime

計算時間間隔,並以星期、天、時、分、秒來表示

示例:

x <- c(1,2,3,4)

mean(x)

# 執行結果:

# [1] 2.5

median(x)

# 執行結果:

# [1] 2.5

sd(x)

# 執行結果:

# [1] 1.290994

var(x)

# 執行結果:

# [1] 1.666667

mad(x)

# 執行結果:

# [1] 1.4826

quantile(x,c(.3,.84))

# 執行結果:

# 30% 84%

# 1.90 3.52

quantile(x,c(.25,.75))

# 執行結果:

# 25% 75%

# 1.75 3.25

range(x)

# 執行結果:

# [1] 1 4

xum(x)

# 執行結果:

# [1] 10

min(x)

# 執行結果:

# [1] 1

max(x)

# 執行結果:

# [1] 4

diff(x)

# 執行結果:

# [1] 1 1 1

data <- c("2016-1-27","2016-2-27")

difftime(data[2],data[1],units="days")

# 執行結果:

# time difference of 31 days

difftime(data[2],data[1],units="weeks")

# 執行結果:

# time difference of 4.428571 weeks

difftime(data[2],data[1],units="hours")

# 執行結果:

# time difference of 744 hours

difftime(data[2],data[1],units="mins")

# 執行結果:

# time difference of 44640 mins

difftime(data[2],data[1],units="secs")

# 執行結果:

# time difference of 2678400 secs

分布名稱

縮寫分布的引數名稱及預設值

beta分布

beta

shape1,shape2

logistic分布

logis

location=0,scale=1

二項分布

binom

size,prob

多項分布

multinom

size,prob

柯西分布

cauchy

location=0,scale=1

負二項分布

nbinom

size,prob

(非中心)卡方分布

chisq

df正態分佈

norm

mean=0,sd=1

指數分布

exprate=1

泊松分布

pois

lambda

f分布f

df1,df2

r語言中mpg資料 R語言常用的資料處理的包 1

在r中有很多的內建函式,比如transform rbind cbind 等函式,這些函式我們可以直接使用,除此之外,還有常見的幾種包在處理資料的時候非常好用。dplyr包 dplyr包是hadley wickham ggplot2包的作者,被稱為 乙個改變r的人 的傑作,dplyr可用於處理r內部或...

R語言 資料處理 R做資料處理中的小技巧

一 主要內容 建立新變數 修改資料 修改變數名 處理缺失值 資料排序 資料合併 資料篩選 抽樣二 r語言 rm list ls gc manager c 1,2,3,4,5 date c 10 24 08 10 28 08 10 1 08 10 12 08 5 1 09 country c us u...

R 資料處理

setwd e rwork set.seed 1234 index sample 1 nrow iris 10,replace t index sample set iris index,index sample nrow iris 0.75 nrow iris sample set iris in...