Pandas字串資料處理

2021-10-20 10:07:27 字數 815 閱讀 6986

import pandas as pd

df = pd.read_excel(

'成績表(統計).xls'

,sheet_name=

'寫入(新)'

)df = df[

'性別'

].astype(

str)

## 字串切片

df['身高_num'

]= df[

'身高'].

str[0:

3]## 去除

df['身高_num'

]= df[

'身高'].

str.strip(

'cm'

)df[

'身高_num'

]= df[

'身高'].

str.replace(

'cm',''

)print

(df.info())

## 轉換成整數型資料

df = df[

'身高_num'

].astype(

int)

## 字串分割(位址)

df = df[

'住址'].

str.split(

',')

df = df[

'住址'].

str.split(

',')

.str[0

]## 字串長度

df = df[

'住址'].

str.

len(

)print

(df)

pandas處理字串

1 dataframe的列 df.columns.str.strip df.columns.str.lower 處理列 清理開頭和結尾的白空格,將所有的名稱都換為小寫,並且將其餘的空格都替換為下劃線 df.columns df.columns.str.strip str.lower str.repl...

pandas 資料處理

pandas中資料可以分為series,dataframe,panel分別表示一維至三維資料。其中在構造時,index表示行名,columns表示列名 構造方式 s pd.series data index index s pd series np random randn 5 index a b ...

pandas資料處理

dataframe.duplicated subset none,keep first 判斷dataframe中的資料是否有重複 必須一行中所有資料都重複才算重複,只能判斷行,不能判斷列 返回series dataframe.drop duplicates subset none,keep firs...