R語言字元處理函式

2021-09-29 19:36:56 字數 1468 閱讀 5699

字元處理函式用於處理文字型資料。

函式描述

nchar(x)

計算x中字元數量

substr(x,start,stop)

提取或替換乙個字元向量中的子串

grep(pattern,x,ignore.case=true,fixed)

在x中搜尋某種模式。fixed=false,pattern為正規表示式。fixed=true,pattern為乙個文字字串。返回值為匹配的下標

sub(pattern,replacement,x,ignore.case=false,fixed=false)

在x中搜尋pattern,並以文字replacement將其替換。fixed引數同grep

strsplit(x,split,fixed=false)

在split處分割字元向量x中的元素

paste(-,sep=』』)

連線字串,分隔符為sep

toupper(x)

大寫轉換

tolower(x)

小寫轉換

#nchar()

a <- c('an','cd','dafsaf')

#檢視a中各字元長度

nchar(a)

[1] 2 2 6

#substr()

b <- 'hfdhkjdshf'

#提取b中第2到5位

substr(b,2,5)

[1] "fdhk"

#grep()

c <- c('a','b','v')

#在c中匹配含有字元a的元素。

grep('a',c)

[1] 1

#sub()

d <- 'my name is bob'

#在d中匹配my將其替換為his

sub('my','his',d,fixed = true)

[1] "his name is bob"

#strsplit()

e <- '**不會點**'

#將e以『會』分割

strsplit(e,'會',fixed=true)

[[1]]

[1] "**不" "點**"

#paste()

#連線x與1:3

paste('x',1:3,sep ='' )

[1] "x1" "x2" "x3"

#toupper()

toupper('myname')

[1] "myname"

#tolower()

tolower('hisname')

[1] "hisname"

r語言

小白速通

r語言小白速通

r語言小白速通懂點

r語

言懂點r語言

懂點r語言歡迎分

享收藏關

注歡迎分享收藏關注

歡迎分享收藏

關注

字串處理函式 R語言

用於字串分割的函式 如strsplit 123abcdefgabcdef ab 1 1 123 cdefg cdef 字串連線 paste paste sep collapse null 字串分割 strsplit strsplit x,split,extended true,fixed false...

R語言 字串處理函式

r語言中字串處理函式 來自base包 函式說 明 nchar x 計算x中的字元數量 substr 提取或替換乙個字元向量中的子串 grep 在字串中匹配某種模式 sub 在字串中搜尋模式,並以另乙個文字替換 strsplit 分割字串 toupper 大寫轉換 tolower 小寫轉換 1 nch...

R筆記 R語言中的字串處理函式

內容概覽 儘管r是一門以數值向量和矩陣為核心的統計語言,但字串同樣極為重要。從醫療研究資料裡的出生日期到文字挖掘的應用,字串資料在r程式中使用的頻率非常高。r語言提供了很多字串操作函式,本文僅簡要以下幾種常用的字串函式。strsplit 函式用於字串分割,其中split是分割引數。所得結果以預設以l...