R語言資料框

2021-09-14 03:11:12 字數 1868 閱讀 9061

r語言學習日記(一)2023年3月30日

一、建立資料框

#讀入txt、csv等格式資料,自動生成資料框,資料編碼為utf-8

movie=read.csv("./電影資料.csv",fileencoding="utf-8",stringsasfactors=f)
#檢視movie的資料型別

class(movie)
二、自己手動建立資料框

> star1 = c("鄧超", "趙麗穎", "郭富城", "周潤發", "傑克布萊克", "湯唯", "白敬亭", "陳曉", "梁家輝", "姚晨", "宋茜", "黃宗澤", "黃曉明")

> birthyear = c(1979, 1987, 1965, 1955, 1969, 1979, 1993, 1987, 1958, 1979, 1987, 1980, 1977)

> gender = c("男", "女", "男", "男", "男", "女", "男", "男", "男", "女", "女", "男", "男")

> stars = data.frame(star1, birthyear, gender)

> head(stars)

star1 birthyear gender

1 鄧超 1979 男

2 趙麗穎 1987 女

3 郭富城 1965 男

4 周潤發 1955 男

5 傑克布萊克 1969 男

6 湯唯 1979 女

三、檢視彙總的資料

str(movie)

summary(movie)

四、資料框的整列以及合併

#增添一列資料prefer

prefer = 1:19

movie$pre = prefer

head(movie)

merge函式將movie資料框與stars資料框按star1進行合併,movie[1:3, ]將資料框的前兩行進行合併

(movie.star = merge(movie[1:3, ], stars,by = "star1"))
五、資料框的檢視和篩選

#檢視第三行的資料

movie[3, ]
#檢視第八列的資料

movie[, 8]
#用$符號通過列名篩選

movie$star1
#選擇資料中的動作影片

(action = movie[movie$type == "動作", ])
#篩選放映時間超過100分鐘的動作影片

(action_long = movie[movie$type == "動作" & movie$duration > 100, ])
六、資料框的內部資料排列

#按票房進行排列order()函式,decreasing = t降序排列,decreasing = f公升序排列

movie = movie[order(movie$boxoffice, decreasing = t), ]
#先按電影型別排列,再按豆瓣評分排列

movie = movie[order(movie$type, movie$doubanscore, decreasing = t), ]

R語言資料框

資料框的建立 通過data.frame函式來建立資料框,該函式包含的主要引數為 data.frame row.names null,check.rows false,check.names true,stringsasfactors default.stringsasfactors 建立乙個資料框 ...

r語言 向量轉換為資料框 R語言 資料框

資料框 概念 在r語言中,資料框 dataframe 組織資料的結構與矩陣相似,但是其各列的資料型別可以不相同。一般情況,資料框的每列是乙個變數,每行是乙個觀測樣本。雖然,資料框內不同的列可以是不同的資料模式,但是資料框內每列的長度必須相同。資料框的建立 01 基本概念 在r語言中,資料框使用dat...

R語言 4 資料框

1 綜述 資料框可以模擬matrix,資料框可以理解為每列的mode不同的matrix 這一點很像list和向量的關係 list是mode可以不同的向量。同時,資料框也可以和list類別,資料框的元件間的mode可以不同,list也是,但是資料框不同組建的長度必須相同,而list可以不同。因此就技術...