pandas處理excel資料

2021-10-11 21:28:09 字數 1336 閱讀 4025

import pandas as pd

f = pd.read_excel(

'name.xlsx'

,'sheet_name'

)# 檢視有重複的行

re_row = f.duplicated(

)# 去除重複行資料

# drop_duplicates(subset=' 列名',keep='firsrt',inplace='true')函式是刪除dataframe的某列中重複項的函式。

no_re_row = f.drop_duplicates(

)# 可以指定刪除哪一列重複資料

no_re_row = f.drop_duplicates(

['c_content'])

# 儲存檔案

f.to_excel(

'name.xlsx'

)# 儲存檔案,無index

f.to_excel(

'name.xlsx', index=

none

)# 儲存檔案,無表頭

f.to_excel(

'name.xlsx', header=

none

)

按照行列刪除指定行列

# drop用法

print

(df_excel.drop(

['edu'

],axis=1)

)#按照列刪除edu這一列

print

(df_excel.drop([0

],axis=0)

)#按照行刪除0這一行

待更新…

pandas讀取csv檔案

import pandas as pd

name =

'tls_icd10cmhumanreadablemap_us1000124_20210301.tsv'

df = pd.read_csv(name,sep=

'\t'

)# 讀取某列元素

df.loc[

'col_name'

]# 刪除兩列元素

df.drop(

['col_name1','col_name2'

],axis=1)

# df.drop(columns=['col_name1','col_name2'])

# 根據某列元素,讀取對應行

df.loc[df[

'referencedcomponentid']==

9982009

]

參考:python 刪除excel**重複行,資料預處理操作

乾貨 利用pandas處理Excel資料

新建乙個excel table1.csv 用於案例講解 df pd.read excel table1.xlsx 相對路徑 df pd.read excel r e anaconda hc datascience table1.csv 絕對路徑 顯示資料的行與列數 df.shape 6,5 顯示資料...

基於pandas的excel資料處理

實現目的 將實驗資料 excel格式 根據date列中資料按照年份劃分成多個資料集並輸出。使用pandas讀取excel檔案未dataframe格式,然後獲取其中date列的資料並進行取最後四位數的操作,迴圈結果所需要的資料集進行判斷 with open filename,r encoding ut...

Excel檔案處理之pandas

pandas可以用來處理多種儲存型別的資料,比如excel csv html sql.檢視pandas.read xx方法可以看出。本文主要總結對excel的處理。pandas依賴處理excel的xlrd等模組,這些模組安裝即可,不需要import。1讀取 1.1多個sheet import pan...