Python 讀取Excel資料並分組統計

2021-09-29 19:01:25 字數 636 閱讀 4869

**

# 匯入這個神奇的包

import pandas as pd

# 參考這個文件

# io 是檔案

# sheet_name 選擇excel 的sheet

# usecols 選擇當前sheet 的前幾列

# names 給每列定義乙個名字

df1 = pd.read_excel(io="e:\\haha\\測試資料.xlsx",sheet_name="sheet2",usecols=[0,1,2,3],names=["sample", "raw_bases_number", "dt", "id"])

# 定義乙個計算公式

data_range = lambda x: x.max() - x.min()

# 根據指定字段分組,agg是聚合部分,聚合的是 raw_bases_number 字段,聚合結果是 最大值、最小值、和上面定義的函式

groupdata = df1.groupby("id").agg()

# 列印一下,貓一眼是啥東西

print(groupdata)

# 輸出

groupdata.to_excel("e:\\haha\\result.xlsx")

python 讀取Excel資料

如果xlrd執行報錯,先解除安裝當前安裝的xlrd pip uninstall xlrd 再安裝低版本的xlrd pip install xlrd 1.2.0 import xlrd import sysimport osdef read excel dict excelpath,sheetname...

讀取Excel資料

方法2 相當簡單,excel就像資料庫,每個sheet就是乙個table.microsoft.jet.oledb驅動.之後是datareader迴圈,或dataset處理都非常簡單.注意 資料型別的轉換 region set connection string strconn provider mi...

讀取Excel資料

excel2007的連線字串與excel2003的不同。datatable tbsheetname connection.getoledbschematable oledbschemaguid.tables,null 用來獲得sheet的名字 using system using system.io...