pandas 文字處理 split

2021-10-10 01:21:00 字數 1416 閱讀 7834

以下為原文**及執行結果

import pandas as pd

#先生成乙個dataframe

d =df1 = pd.dataframe(d)

#lambda 函式的意思是選取x的序列值 ,比如 x[6:9]

#index函式的意思是把當前字元位置轉變為所在位置的位數

#-1是最後一位

df1[

'正確數'

]= df1.iloc[:,

0].(

lambda x : x[x.index(

'(')+1

: x.index(

'/')])

df1[

'總數'

]= df1.iloc[:,

0].(

lambda x : x[x.index(

'/')+1

:-1]

)df1[

'正確率'

這個其實就是個文字切分操作,如果採用pandas自帶的文字處理工具,可以很輕鬆得到結果

這裡存在乙個小bug,資料中切分多出來一列,可以將原資料中的 ()替換成空格,

同時限制切分次數

講究點再做一次strip操作去除多餘空格,再改改標題名。

總結:文字有文字的處理辦法,pandas 中 .str 可以得到文字屬性,然後進行文書處理,處理方法和python自帶的str函式大多相同。

shell文字處理

最於檔案的操作以前都是用高階程式語言來操作的。今天恰好需要將乙個目錄中的檔案資訊儲存到sqlite3資料庫中 我用linux中的工具和shell來作為自己畢業設計做原型開發 下面記錄一下這裡用到的部分知識,以作備忘。用ls命令來說明 1.關於shell中的管道和重定向問題。這個知識基礎,這裡不再說了...

WML 文字處理

wml使用xml文件字符集,目前支援unicode 2.0,和hdml不同,wml的所有標籤,屬性和規定的可接收值必須小寫,card的名字和變數也是區分大小寫的。和hdml一樣,對於連續的空字元,只顯示乙個空格。標籤內屬性的值必須用 或者 括起來,屬性名,和值之間不能有空格。對於不成對出現的標籤,必...

shell 文字處理

最近優化指令碼,將幾套指令碼合併,比如,處理nand手機的指令碼和處理emmc手機的指令碼是不一樣的,這導致我們的指令碼有很多個版本。手機側只有busybox,所以不能使用功能強大的python來處理文字。花了半天時間,發現雖然語法比較怪異,但也能簡潔的完成任務。if e proc emmc the...