R 資料處理

2021-09-20 00:09:43 字數 1454 閱讀 9871

setwd("e:\\rwork")

set.seed(1234)

index <- sample(1:nrow(iris),10, replace = t)

index

sample_set <- iris[index,]

index <- sample(nrow(iris),0.75*nrow(iris))

sample_set <- iris[index,]

data(iris)

buckets <- 10

maxseplen <- max(iris$sepal.length)

minseplen <- min(iris$sepal.length)

cutpoints <- seq(minseplen, maxseplen, by = (maxseplen - minseplen ) / buckets )

cutpoints

cutseplen <- cut(iris$sepal.length, breaks = cutpoints , include.lowest = true)

newiris <- data.frame(contseplen = iris$sepal.length , discseplen = cutseplen)

newiris

最常用merge()函式,但是這個函式使用時候這兩種情況需要注意:

1、merge(a,b),純粹地把兩個資料集合在一起,沒有溝通a、b資料集的by,這樣出現的資料很多,相當於a*b條資料;

2、merge函式是匹配到a,b資料集的並,都有的才匹配出來,如果a、b資料集id不同,要用all=t(下面有all用法的**)。

id<-c(1,2,3,4)  

name<-c("jim","tony","lisa","tom")

score<-c(89,22,78,78)

student1<-data.frame(id,name)

student2<-data.frame(id,score)

total_student<-merge(student1,student2,by="id") #或者rbind()

total_student

id<-c(1,2,3)  

name<-c("jame","kevin","sunny")

student1<-data.frame(id,name)

id<-c(4,5,6)

name<-c("sun","frame","eric")

student2<-data.frame(id,name)

total<-cbind(student1,student2)

total

R語言 資料處理 R做資料處理中的小技巧

一 主要內容 建立新變數 修改資料 修改變數名 處理缺失值 資料排序 資料合併 資料篩選 抽樣二 r語言 rm list ls gc manager c 1,2,3,4,5 date c 10 24 08 10 28 08 10 1 08 10 12 08 5 1 09 country c us u...

R語言日期資料處理

在處理一些資料中,我經常遇到一些日期資料,今天就來說說對於不同格式的日期資料該怎麼處理。下面是一些常用來處理的函式。as.date x,s3 method for class character as.date x,format,s3 method for class numeric as.date...

R語言 資料處理 R語言資料變形melt用法

1 需要安裝的包 install.packages reshape2 install.packages knitr 2 載入包 rm list ls gc library reshape2 library knitr 3 建立資料集 data data4 變形之前資料展示 kable data,fo...