dataframe常用功能整理

2021-10-05 01:26:20 字數 2862 閱讀 4579

#去除某幾列重複的行資料。'a','b'相同,則刪除重複行,保留第乙個。keep引數可以為first、last和false(不保留)

df.drop_duplicates(subset=

['a'

,'b'

],keep=

'first'

,inplace=

true

)#去除完全重複的行資料。保留第乙個

df.drop_duplicates(keep=

'first'

,inplace=

true

)

df.rename(columns=

,inplace=

true

)

#方法一:

from sklearn.utils import shuffle

df = shuffle(df)

#方法二:

#引數frac是要返回的比例。frac=0.3,表示抽樣30%的樣本;

#reset_index(drop=true)。表示打混後資料集的index(索引)還是按照正常的排序

按列拼接

按行拼接

(1)引數how:

inner:拿出的是兩邊都有的值。返回的結果是左右列的交集

outer:將 left、right的資料結合, 所有的行和列都拿出來,哪邊缺失,就補充nan。返回的結果是左右列的並集

left:按照left的dataframe為基準,右邊值為空的話就預設nan。返回的結果只包含左列

right:按照right的dataframe為基準,左邊值為空的話就預設nan。返回的結果只包含右列

(2)引數on:

key:代表在那幾列上進行merge

data=pd.merge(data1,data2,how=

'inner'

,on=

'left'

)

(3)重新命名:
data3 = pd.dataframe(

(4)merge的三種操作:

(5)merge幾點說明

POI常用功能整理

讀取.xlsx常見方式有 1.workbook wb new xssfworkbook new fileinputstream filename 2.workbook wb workbookfactory.create new file filename 讀取.xls常見的方式有 1.workboo...

SAP常用功能

1 sap外觀 幫助圖示右側的按鈕是customizing of local layout 定製本地布局 按鈕,可以用它來變更sap gui顯示介面的風格。2 sap導航 1 在sap print list視窗裡,如果不想在保持期內儲存系統假離線請求,在print screen list 列印頁面列...

IOS 常用功能

對xib檔案的處理 xib的載入可以通過 nsbundle maibundle loadnibnamed nsstring str owner nsstring temp dic nsdictionary dic 載入 xib的fileowner檔案。然後通過下標得到sub 如果要獲取xib中固定的...