Python中如何進行資料分組

2021-09-30 13:31:31 字數 829 閱讀 8818

根據資料分析物件的特徵,按照一定的數值指標,把資料分析物件劃分為不同的區間進行研究,以揭示其內在聯絡和規律性。

cut 函式:

cut(series,bins,right=true,labels=null)

① series  需要分組的資料

② bins    分組的劃分陣列

③ right   分組的時候,右邊是否閉合,預設為閉合true

④ labels  分組的自定義標籤,可以不自定義

import pandas

data = pandas.read_csv(

'd:\\pda\\4.15\\data.csv',

sep='|'

)#理解為什麼我的bins區間要-1和+1

bins = [

min(data.cost)-1, 20, 40, 60,

80, 100, max(data.cost)+1

]data['cut'] = pandas.cut(

data.cost,

bins

)data['cut'] = pandas.cut(

data.cost,

bins,

right=false

)labels = [

'20以下', '20到40', '40到60',

'60到80', '80到100', '100以上'

]data['cut'] = pandas.cut(

data.cost, bins,

right=false, labels=labels

)

如何進行資料同步

建立資料庫的鏈結 create database link dblink test connect to 需要鏈結的資料庫的名字 identified by 密碼 using 這個鏈結的別名 建立物化檢視用於同步資料 create materialized view test test是同步過來的實...

BW中如何進行資料監控?

這周輪到我值班,要凌晨4點爬起來,做一些edw日常抽數的監控,處理下錯誤。今天一切正常,有點無聊,就碼點字吧。bw進入運維階段之後,日常的資料抽取監控便成了運維中乙個很重要的工作。關於自動抽數 通常,生產系統的資料都是通過process chain 進行自動抽取的。高階一點的,會用event去觸發p...

如何進行資料的匯出?

function exporttoexcel function layerindex 在控制器的寫法 public actionresult exporttoexcel 為客戶資訊的excel檔案命名 拼接了名稱 年月日和檔案的字尾名 string filename 客戶資訊 datetime.no...