R語言學習筆記（R物件和資料組織）

基本函式：

search()瀏覽已載入包的名稱

library（）檢視包的功能說明

library(help=)瀏覽指定包中的函式

library（包名稱）載入指定包到工作空間

help.start()啟動r的幫助文件

help（函式名）

help.search()瀏覽包含指定字串的函式的幫助文件

detach(package:包名稱)從工作空間解除安裝指定包

installpackages()安裝包

update.packages()更新包

new.packages()顯示尚未安裝的新包列表

getwd()獲取當前工作目錄

setwd（）設定當前工作目錄

source（）執行指定程式

sink（「結果檔名」）控制台輸出儲存到指定結果檔案

r資料物件，向量，矩陣，陣列，資料框，列表

檢視資料物件的結構：str（物件名）

管理資料物件ls（）

刪除工作空間物件rm（物件名或物件列表）

is.(vector,factor,matrix,array,list),判斷

建立向量函式c

重複函式：rep（起始值：終止值，each=重複次數）排列重複，rep（起始值：終止值，time=重複次數）迴圈重複

序列：sep（from=，to=，by=/length=）

鍵盤輸入scan（）

建立指定長度的向量vector(length=)

訪問指定位置元素xx[c()],向量名[位置向量]

訪問元素之外的元素xx[-c()]

矩陣操作

cbind(向量名列表)按列組塊，同理rbind（）

dim(),colnames(矩陣名或矩陣指定列),rownames(矩陣名或矩陣指定列)

matrix(向量名，nrow=，ncol=，byrow=t/f，dimnames=list(行名錶，列名表))

head（），tail（）

fix（）視窗編輯訪問矩陣

資料框：

data.frame(網域名稱n=向量n)

names（資料框名）顯示各個網域名稱

資料框$網域名稱

attach(資料框名),detach(資料框名)，繫結和解綁資料框（可直接引用網域名稱）

with（資料框名，）（{}內的物件均為區域性物件）

修改資料框：

資料框名<- within（資料框名，）（{}內的物件均為區域性物件）

陣列：

array(向量名，維度說明，dimnames=list(維名稱列表))

訪問陣列：陣列名[行號，列號，錶號]

列表：

list(成分名n=物件名n)

names（列表名）顯示成分名

訪問列表：列表名$成分名

儲存型別：

is.儲存型別名（資料物件）numeric,integer,double,character,logical

檢視儲存型別;typeof(資料物件)

型別轉換：as.儲存型別名（資料物件）

*型別轉換會影響精度，邏輯型只能通過0,1轉換

因子：

levels(因子名)，nlevels(因子名)，分別取水平值和水平數

factor(向量名，order=t/f,levels=c(類別列表值))

建立因子：gl（水平個數，水平出現次數）

資料管理：

讀取文字到向量：scan（file=「檔名」，skip=行數，what=儲存型別轉換函式（））

讀取文字到資料框;read.table(file=「檔名」，header=t/f，sep=「資料分隔符」，stringasfactors=t/f)讀入是文字字串自動轉換因子，並按字母排序比較耗時

網頁資料：

library(「xml」)

url <- **

資料 <- readhtmltable（**）

str（資料）顯示列表結構資訊

網頁內容被視為字元讀入列表，列表成分均為因子

資料儲存：

包分類：數學，統計，概率，字串，資料管理，檔案管理

整除%/%,求餘數：%%包含：%in%

數學函式：

abs(),sqrt(),ceiling(),floor(),trunc(),round(x,digits=n),signif(x,digits=n),sin,cos,tan,log(x,base=n),log(),exp()

概率函式：

dnorm(x,mean=,sd=)密度值

pnorm(x,mena=,sd=)累計概率

dnorm(p,mean=,sd=)分位值

rnorm(x,mean=,sd=)生成隨機數，set.seed(123)設定種子保證隨機數重現

分布;

bate,binom(),cauchy(),chisq(),exp(),f(),gamma(),geom(),lnorm(),logis(),multinom()nbinom(),norm,posi,signrank(),t,unif(),weibull()

統計函式：

mean(),median(),sd(),var(),range()取值範圍，max(),length(0,min(),sum(),cumsum(),sumprod()cummax(),cumin()prod()

quantile(x,probs)probs*(n-1)+1求x在probs的分位值

cut(x,n)將x分成n組

scale(x)x標準化處理，減去均值除以其標準差

diff(x,lag=n)x的n項差分

rank(x)x的秩，公升序的順序，同名次求平均

cor(x1,x2)

cov(x1,x2)

矩陣運算函式：

矩陣乘法;%*%

diag(n)行列為n的單位陣

diag(x)建立正對角元素取x向量的矩陣

diag(x)訪問矩陣x的正對角元素

t(x)矩陣x轉置

solve（x）求逆矩陣

eigen（x）求特徵值和特徵向量

det（）求行列式

lower/upper.tri(x,diag=t/f)取上下三角部分，包括或不包括正對角

outer(x,y,fun=)計算外積指定運算子或函式名

字串函式：

nchar(),substr(x,n,m)取x中n至m的字串

grep(p,x)計算p出現在x的第幾個元素中，p可以為正規表示式『.』代表乙個字元『*』代表0或多個

gsub(p,a,x)將x中的p替換為a，p可以是正則

strsplit(x,s)以s為分隔符分割x

paste(x,y,sep=s)以s為分隔符連線x，y

toupper(),tolower()大小寫轉換

資料管理函式：

unique(x)x為向量或者資料框

sort(x,decreasing=false)返回排列之後的結果

order(x,decreasing=false)返回排序後的下標

rev(x)倒敘

which(條件表示式)返回滿足條件的數值

which.min/max(x)返回最大最小值首次出現的位置

table(x)返回x的頻數分布表

table(x1,x2)返回列聯表

colsums(x)colmeans(x)計算矩陣或資料框的列合計和均值（數值型）行同理

aggregate(x,by=list(g1,g2),fun=)按g1,g2交叉分組對資料框x計算指定函式

merge(x1,x2,by=」關鍵字」)依據關鍵字合併資料框，並按關鍵字排序

subset(x,關係表示式)提取資料框x中關係表示式為真的資料子集

sample(x,size=n,prob=c(),replace=t/f)按入樣概率在向量x中有放回或無放回的抽取n個樣本

邏輯判斷函式：

is.na(x)判斷向量x中是否有缺失值

is.nan(x)

complete.cases(x)判斷資料框向量矩陣x觀測值是否完整（不包含na，nan）

is.unsorted(x)判斷是否排序

any(邏輯向量x)是否至少有乙個元素取true

x%in%y 判斷向量x的元素是否在向量y中

R語言學習筆記

1.資料輸入 read.table n fileposition 函式 eg.x read.table c users administrator desktop 1.txt header t 目前只知道可以完好地讀入txt檔案空格隔開 excel不支援 csv讀入不完全。ps.可以用excel生...

R語言學習筆記

二 data.frame資料框的常用操作三讀取資料檔案四排序函式 sort，rank，order 的區別 mydata tid s1 s2 1 1 2 1 2 1 2 1 3 1 3 2 4 2 4 3 5 3 5 4 unique mydata tid s1 s2 1 1 2 1 3 1 ...

R語言學習筆記

r語言的特點 r網路資源常用命令安裝某個包 install.packages alr4 檢視函式用法比如要實現t檢驗，可以輸入?t.test 然後重點看usage和example。也可以用help t.test lm函式名及所在包 fitting linear models標題 descrip...

R語言學習筆記（R物件和資料組織）

R語言學習筆記

R語言學習筆記

R語言學習筆記

相關推薦