R語言 字串處理函式

2021-10-21 14:08:37 字數 1796 閱讀 3965

r語言中字串處理函式(來自base包)

函式說 明

nchar(x)

計算x中的字元數量

substr()

提取或替換乙個字元向量中的子串

grep()

在字串中匹配某種模式

sub()

在字串中搜尋模式,並以另乙個文字替換

strsplit()

分割字串

toupper()

大寫轉換

tolower()

小寫轉換

(1)nchar()

x <- c(

'ab'

,'cde'

)length(x)[1

]2nchar(x)[2

]23

(2)

substr()函式

語法:substr(x, start, stop)

引數說明:提取或替換乙個字串中的子串,start為開始位置,stop為結束位置

x <-

'abcdefg'

substr(x,2,

4)# 提取子字串[1

]'bcd'

substr(x,2,

4)<-

'2'#替換子字串

#替換的字串個數大於要替換的字串個數,多於部分不變x[

2]'a2cdefg'

substr(x,2,

4)<-

'222'x[

3]'a222efg'

(3) grep()函式

語法:grep(pattern, x, ignore.case = false, fixed = false)

引數說明:在x中搜尋某種模式,若fixed = false, 則pattern為乙個正規表示式;若fixed = true, 則pattern為乙個文字字串,返回值為匹配的下標。

grep(

'a', c(

'b',

'a',

'c'))[

1]2

(4)sub()函式

語法:sub(pattern, replacement, x, ignore.case = false, fixed = false)

引數說明:在x中搜尋pattern,並用文字replacement將其替換。若fixed = false, 則pattern為乙個正規表示式;若fixed = true, 則pattern為乙個文字字串。ignore.case用於設定是否忽略大小寫

sub(

'abc'

,'#'

,'abcdefk')[

1]'#defk'

(5)strsplit()函式

語法:strsplit(x, split, fixed = false)

引數說明:在split處分割字元向量x中的元素。若fixed = false, 則pattern為乙個正規表示式;若fixed = true, 則pattern為乙個文字字串。

strsplit(

'abc',''

)[1]

'a''b'

'c'

(6)toupper()和tolower()函式

x <-

'abcdabe'

tolower(x)[1

]'abcdabe'

toupper(x)[2

]'abcdabe'

字串處理函式 R語言

用於字串分割的函式 如strsplit 123abcdefgabcdef ab 1 1 123 cdefg cdef 字串連線 paste paste sep collapse null 字串分割 strsplit strsplit x,split,extended true,fixed false...

R語言處理字串

用於字串分割的函式 如strsplit 123abcdefgabcdef ab 1 1 123 cdefg cdef 字串連線 paste paste sep collapse null 字串分割 strsplit strsplit x,split,extended true,fixed false...

R語言中的字串處理函式

儘管r是一門以數值向量和矩陣為核心的統計語言,但字串同樣極為重要。從醫療研究資料裡的出生日期到文字挖掘的應用,字串資料在r程式中使用的頻率非常高。r語言提供了很多字串操作函式,本文僅簡要以下幾種常用的字串函式。字串分割函式 strsplit 字串連線函式 paste 計算字串長度 nchar 字串擷...