python使用pandas處理excel資料

2021-10-24 22:34:13 字數 1279 閱讀 9912

使用python pandas庫讀取excel檔案(.xlsx, .xls)。 使用pandas的 read_excel()方法來讀取excel資料,可以讀取第乙個sheet,指定的sheet,多個sheet或所有的sheet。pandas會將這些資料轉化成乙個 dataframe結構,它是乙個扁平的結構來的。接著就可以對資料進行資料分析了。

pandas的read_excel方法內部會使用xlrd庫。xlrd是乙個用於讀取excel檔案(.xlsx, .xls)的庫。使用anaconda安裝xlrd庫:

$ conda install xlrd
作為本篇的主角pandas,當然是要安裝的了。

$ conda install pandas
預設讀取第一張sheet。

import pandas as pd

df = pd.read_excel(

'sample.xlsx'

)print(df)

通過指定read_excel方法的sheet_name引數來指定。可以通過數字來指定是第幾張:

import pandas as pd

df_sheet_index = pd.read_excel(

'sample.xlsx'

, sheet_name=1)

print(df_sheet_index)

也可以直接指定sheet的名字:

import pandas as pd

df_sheet_name = pd.read_excel(

'sample.xlsx'

, sheet_name='sheet2'

)print(df_sheet_name)

可以通過數字或名稱來指定這幾張sheet。

import pandas as pd

df_sheet_multi = pd.read_excel(

'sample.xlsx'

, sheet_name=[0,

'sheet2'])

print(df_sheet_multi)

import pandas as pd

df_sheet_all = pd.read_excel(

'sample.xlsx'

, sheet_name=none)

print(df_sheet_all)

Python 使用Pandas進行資料預處理

利用pandas庫中的get dummies函式對類別型特徵進行啞變數處理。get dummies語法 pandas.get dummies data,prefix none,prefix sep dummy na false,columns none,sparse false,drop first...

pandas中to datetime 時間處理

pandas.to datetime arg,errors raise utc none,format none,unit none pandas通常用於處理成組日期,不管這些日期是dataframe的軸索引還是列,to datetime方法可以解析多種不同的日期表示形式。1 獲取指定的時間和日期 ...

python初探 pandas使用

pandas 是基於numpy 的一種工具,該工具是為了解決資料分析任務而建立的。pandas 納入了大量庫和一些標準的資料模型,提供了高效地操作大型資料集所需的工具。pandas提供了大量能使我們快速便捷地處理資料的函式和方法,pandas為時間序列分析提供了很好的支援。series 和 data...