pandas的常規操作(二)

2021-09-19 06:13:00 字數 1313 閱讀 2169

import pandas as pd

import numpy as np

detail =pd.read_excel(r』檔名.xlsx』)

############# 分組聚合內計算 ##############

### 第一種聚合:通過簡單的統計函式

detaigeoup =detail[['列索引1','列索引2','列索引3']].groupby(by='索引1') # by:以誰為聚合

### 第二種聚合:

# agg:不同字段要求相同的統計函式

print(detail[['列索引1','列索引2']].agg([np.mean,np,sum]))

# agg:對不同字段要求不同的統計函式

print(detail.agg())

print(detai.agg())

### transform 方法聚合:func

print(detai[['列索引1','列索引2']].transform(lambda x:x*2).head())

################# 透視表與交叉表 ################

### 1.透視表

## index:行分組鍵

detailpivot =pd.pivot_table(detai[['counts','order_id','amounts','dishes_name']],index=['order_id','dishes_name'],aggfunc=np.sum)

## columns: 列分組鍵

detailpivot = pd.pivot_table(detai[['counts', 'order_id', 'amounts', 'dishes_name']], values='counts', columns='dishes_name',aggfunc=np.sum)

## 行列都用

detailpivot = pd.pivot_table(detai[['counts', 'order_id', 'amounts', 'dishes_name']],values='counts', index='order_id', columns='dishes_name',aggfunc=np.sum, fill_value=0, margins=true) # margins :是否求和

### 2.交叉表

print(pd.crosstab(index=detai['列索引1'],columns =detai[列索引2],values=detai['列索引3],aggfunc=np.sum))

pandas的基本操作(二)

dataframe在展現形式上像極了陣列,但是在資料處理中又和excle,資料庫非常類似。我們知道,對於陣列的處理,不管是python還是c語言,都是按照先行後列的方式方法進行處理。但是在dataframe中查詢和修改元素,既可以先行後列,也可列後行。首先定義好了一組資料 import pandas...

Pandas的基本操作(二)

必須從過去的錯誤學習教訓而非依賴過去的成功。函式 loc 用法 例如獲取第乙個樣本 data 1 data.loc 0 也可以獲取多個樣本,這時需要傳入乙個列表即可 例如,獲取第3和第5個樣本 datas data.loc 2,4 還可以進行切片處理 例如,獲取第3到第9個樣本 datas data...

JBPM的常規操作

1.撤回到上乙個節點 刪除高經理審批之後所有的節點的審批意見 如果流程已經結束,需要處理流程例項表 delete fw wf course c where f.course id in 227072 and f.process instance id 2262335 1654048 將流程回滾到系統...