python pandas str列內建方法

2021-10-18 05:15:36 字數 1212 閱讀 7143

pandas的dataframe,有時需要處理一些字串型別列,運用series.str列內建方法很方便。0

0.提取數字

f[『comment1』]=f[『comment』].str.extract(』(\d+)』)

提取該列中的數字,若無數字則為none,如:afc12.123 提取到12

1.one hot 獨熱編碼,get_dummies

series=data[『列名』].str.get_dummies(sep=』,』)

實現dataframe中列有多值,且想把這列one hot下

2.切分字串,split()

series=data[『列名』].str.split(』,』)

把dataframe列中字串以』,'分隔開,每個元素分開後存入乙個列表裡

series=data[『列名』].str.split(』,』,expand=true)

引數expand,這個引數取true時,會把切割出來的內容當做一列,產生多列。

series=data[『列名』].str.split(』,』,expand=true)[0]

可以只要第一列。

3.替換,replace()

series=data[『列名』].str.replace(』,』,』-』)

用『-』代替『,』

4.是否包含表示式,contains()

series=data[『列名』].str.contains(『we』)

返回的是布林值series

5.查詢所有符合正規表示式的字元findall()

series=data[『列名』].str.findall("[a-z]")

以陣列的形式返回

6.計算字串的長度,len()

series=data[『列名』].str.len()

7.去除前後的空白字元,strip()

series=data[『列名』].str.strip()

rstrip() 去除後面的空白字元

lstrip() 去除前面的空白字元

8.isalnum() 是否全部是數字和字母組成

isalpha() 是否全部是字母

isdigit() 是否全部都是數字

isspace() 是否空格

islower() 是否全部小寫

isupper() 是否全部大寫

istitle() 是否只有首字母為大寫,其他字母為小寫

python pandas str列內建方法

pandas的dataframe,有時需要處理一些字串型別列,運用series.str列內建方法很方便。1.one hot 獨熱編碼,get dummies series data 列名 str.get dummies sep 實現dataframe中列有多值,且想把這列one hot下 2.切分字...

python pandas str列內建方法

pandas的dataframe,有時需要處理一些字串型別列,運用series.str列內建方法很方便。1.one hot 獨熱編碼,get dummies series data 列名 str.get dummies sep 實現dataframe中列有多值,且想把這列one hot下 2.切分字...

scrapy crawlspider內建方法原始碼

有經驗的同學都知道它是乙個列表,儲存的元素時rule類的例項,其中每乙個例項都定義了一種採集站點的行為。如果有多個rule都匹配同乙個鏈結,那麼位置下標最小的乙個rule將會被使用。init 在原始碼中可以看到,它主要就是執行了 compile rules方法,這邊暫時不講。parse 預設 方法,...