R語言中的字串處理函式

2021-09-29 17:38:25 字數 913 閱讀 1047

儘管r是一門以數值向量和矩陣為核心的統計語言,但字串同樣極為重要。從醫療研究資料裡的出生日期到文字挖掘的應用,字串資料在r程式中使用的頻率非常高。r語言提供了很多字串操作函式,本文僅簡要以下幾種常用的字串函式。

字串分割函式:strsplit( )

字串連線函式:paste( )

計算字串長度:nchar( )

字串擷取函式:substr( )及substring( )

字串替換函式:chartr( )

大小寫轉換函式:toupper( )、tolower( )及casefold( )

字串分割函式:strsplit( )

strsplit( )函式用於字串分割,其中split 是分割引數。所得結果以預設以list形式展示。

字串連線函式:paste( )

主要引數:paste(…, sep = " ", collapse = null)

paste( )函式用於字串連線,其中sep 負責兩組字串間的連線;collapse 負責一組字串內部的連線。

計算字串長度:nchar( )

nchar( )返回字串的長度。

字串擷取函式:substr( );substring( )

substr( )函式和substring( )函式是擷取字串最常用的函式,兩個函式功能方面是一樣的,只是其中引數設定不同。

substr( )函式:必須設定引數start和stop,如果缺少將出錯。

substring( )函式:可以只設定first引數,last引數若不設定,則預設為1000000l,通常是指字串的最大長度。

詳情見:

gsub()可以用於欄位的刪減、增補、替換和切割,可以處理乙個欄位也可以處理由欄位組成的向量。

具體的使用方法為:gsub(「目標字元」, 「替換字元」, 物件)

R筆記 R語言中的字串處理函式

內容概覽 儘管r是一門以數值向量和矩陣為核心的統計語言,但字串同樣極為重要。從醫療研究資料裡的出生日期到文字挖掘的應用,字串資料在r程式中使用的頻率非常高。r語言提供了很多字串操作函式,本文僅簡要以下幾種常用的字串函式。strsplit 函式用於字串分割,其中split是分割引數。所得結果以預設以l...

字串處理函式 R語言

用於字串分割的函式 如strsplit 123abcdefgabcdef ab 1 1 123 cdefg cdef 字串連線 paste paste sep collapse null 字串分割 strsplit strsplit x,split,extended true,fixed false...

R語言 字串處理函式

r語言中字串處理函式 來自base包 函式說 明 nchar x 計算x中的字元數量 substr 提取或替換乙個字元向量中的子串 grep 在字串中匹配某種模式 sub 在字串中搜尋模式,並以另乙個文字替換 strsplit 分割字串 toupper 大寫轉換 tolower 小寫轉換 1 nch...