R資料框操作 fourth day

2021-09-27 05:05:58 字數 1960 閱讀 8614

#匯入資料集

install.packages("readxl")

library(readxl)

tianmao<-read_excel('tianmaotv.xlsx',skip =1 )

#建立新變數

tianmao['total_sales']<-tianmao$current_price*tianmao$month_sales_count

tianmao[c('current_price','month_sales_count','total_sales')]

tianmao

tianmao$zhekou<-tianmao$current_price/tianmao$original_price

tianmao$zhekou

#條件判斷

a<-1:10

ifelse(a%%2==0,'偶數','奇數')

#對**分類

tianmao['price_class']<-ifelse(tianmao$current_price<1000,'低價',

ifelse(tianmao$current_price<=2000,'適中','**'))

tianmao[c('price_class','current_price')]#建立新變數 對之前的變數直接操作 第二章對變數進行判

#重新命名

names(tianmao)#返回列名

names(tianmao)[1]<-'mingcheng' #修改第一列

view(tianmao)#檢視

#不知道列在第幾個

%in% #判斷前乙個向量的元素是否在後面的向量中

names(tianmao)[1]<-'mingcheng'

names(tianmao)%in%"weight"

names(tianmao)[names(tianmao)%in%"weight"]<-'zhongliang'

names(tianmao)#變數重名名

#從資料集中提取子集

newdata<-tianmao[,-c(1:3)]

newdata

names(newdata)

names(tianmao)

剔除資料集

col1<-c('mingcheng','description','current_price')

logical<-names(tianmao)%in%col1

#當作索引刪除子集

newdata1<-tianmao[,!logical]

view(newdata1)

#對行進行操作

tianmao[1,] #第一行

logical1<-tianmao$brand=='xiaomi/小公尺'

#提取觀測

xiaomi<-tianmao[logical1,]

view(xiaomi)

logical1

#提取子集的方法

?subset

xiaomi1<-subset(tianmao,brand=='xiaomi/小公尺',c("mingcheng","description"))

names(tianmao)

匯入 tianmaotv.xlsx,並把資料集命名成 tianmao_2,以下操作都基於 tianmao_2 數

據集提取當前**(current_price)小於 1000 的所有觀測

在資料集 tianmao_2 中生成乙個新列,將新列命名為 stock_class。

當庫存(stock)等於 0,stock_class 的值為'無貨';

庫存(stock)小於 100,stock_class 的值為'低庫存';

庫存(stock)大於等於 100,stock_class 的值為'高庫存'

提取 tianmao_2 的 stock、stock_class 兩列

將列名為"shop_id","shop_name" 的兩列刪除掉

R 資料框操作

1.按條件提取某些樣本 data subj age presentation product choice 1 1 m 21 absdiff pillow y 2 1 m 21 absdiff table y 3 1 m 21 absdiff helmet y 4 1 m 21 absdiff ne...

R語言Data Frame資料框常用操作

data frame一般被翻譯為資料框,感覺就像是r中的表,由行和列組成,與matrix不同的是,每個列可以是不同的資料型別,而matrix是必須相同的。data frame每一列有列名,每一行也可以指定行名。如果不指定行名,那麼就是從1開始自增的sequence來標識每一行。使用data.fram...

R語言資料框的簡易操作

在r語言中,資料框可以通過函式data.frame 建立,格式如下 mydate data.frame col1,col2,col3,其中col1,col2,col3可為任何型別的列向量,每一列的名稱可由names指定。下面我們舉個簡單的例子 playerid seq 0,10 age seq 20...