基於pandas的excel資料處理

2021-10-17 20:31:35 字數 981 閱讀 3439

實現目的:將實驗資料(excel格式)根據date列中資料按照年份劃分成多個資料集並輸出。

使用pandas讀取excel檔案未dataframe格式,然後獲取其中date列的資料並進行取最後四位數的操作,迴圈結果所需要的資料集進行判斷

with

open

(filename,

'r',encoding=

'utf-8'

)as f:

datatotal = pd.read_excel(filename,sheet_name=0)

range

= np.arange(

2002

,2003

)for year in

range

:print

('------year------'

+str

(year)

) result = pd.dataframe(columns=datatotal.columns.to_list())

for index in datatotal.index:

datai = datatotal.loc[index]

# print(datai)

ifstr

(datai[

'date'])

[-4:

]==str(year)

:true

)# print(head['date'])

result.to_csv(

'e:\data\\'

+str

(year)

+'.csv'

)```

datai = datatotal.loc[index]

pandas讀取excel檔案

import pandas as pd 先將檔案讀到記憶體中形成乙個datefream people pd.read excel r people.xlsx 檢視行數和列數 print people.shape 檢視列名 當直接列印datefream時 id不會顯示 datefream對待index...

pandas讀寫Excel檔案

pandas是基於numpy的乙個資料分析python包,pandas讀取excel檔案需要匯入pandas包 import pandas as pd下面簡單記錄pandas對excel的讀寫操作,以便後續檢視。原始碼可參考 github 現有檔案example.xlxs如下 讀取excel檔案,並...

pandas 讀取Excel檔案

注意 讀取檔案會自動建立索引index,直接儲存dataframe為excel檔案會多一行index!預設第一行為欄位名 people pd.read excel d temp people.xls 注意 若前面有若干空行,則自動跳過 指定欄位名的行 無字段行,header none,pandas為...