pandas的統計分析

import pandas as pd

import numpy as np

data = pd.read_excel("./meal_order_detail.xlsx")

print(『data：\n』, data)

print(『data 的列索引：\n』, data.columns)

print(『data 的資料型別：\n』, data.dtypes)

print(』*』 * 100)

print(『amounts counts 列的最小值：\n』,data.loc[:,[『amounts』,『counts』]].min())

print(type(data.loc[:,[『amounts』,『counts』]].min())) #

#對 amounts 進行統計指標

#print(『amounts 列最小值：\n』, data.loc[:, 『amounts』].min())

#print(『amounts 列最大值：\n』, data.loc[:, 『amounts』].max())

print(『amounts 列均值：\n』, data.loc[:, 『amounts』].mean())

#print(『amounts 列方差：\n』, data.loc[:, 『amounts』].var())

#print(『amounts 列標準差：\n』, data.loc[:, 『amounts』].std())

#print(『amounts 列極差：\n』, data.loc[:, 『amounts』].ptp())

#print(『amounts 列非空數值的數量：\n』, data.loc[:, 『amounts』].count())

#print(『cost 列非空數值的數量：\n』, data.loc[:, 『cost』].count())

#print(『amounts 列最大值的下標：\n』, data.loc[:, 『amounts』].idxmax()) # np.argmax

#print(『amounts 列最小值的下標：\n』, data.loc[:, 『amounts』].idxmin()) # np.argmin

#print(『amounts 列的眾數為：\n』,data.loc[:,『amounts』].mode())

#print(『amounts 列的眾數為的型別為：\n』,type(data.loc[:,『amounts』].mode()))

#print(『dishes_name 列的眾數為：\n』,data.loc[:,『dishes_name』].mode())

#print(『amounts 列的中位數：\n』,data.loc[:,『amounts』].median())

#print(『amounts 列的分位數：\n』,data.loc[:,『amounts』].quantile())

#print(『amounts 列的分位數：\n』, data.loc[:, 『amounts』].quantile(q=np.arange(0, 1 + 1 / 4, 1 / 4)))

#print(『amounts 列的分位數：\n』, data.loc[:, 『amounts』].quantile(q=np.arange(0, 1 + 1 / 5, 1 / 5)))

#分位數–min 25% 50% 75% max

#對 amounts 列進行 describe描述

#print(『amounts 列進行describe 描述：\n』,data.loc[:,『amounts』].describe())

#data.loc[:, 『dishes_name』] = data.loc[:, 『dishes_name』].astype(『category』)

data.loc[:, 『dishes_name』] = data.loc[:, 『dishes_name』].astype(『object』)

print(『dishes_name 列的describe 描述：\n』, data.loc[:, 『dishes_name』].describe())

print(『data 的資料型別：\n』,data.dtypes)

pandas統計分析基礎（2）

pandas描述性統計方法的常見方法方法統計含義方法統計含義 min最小值 max最大值 mean 均值count 非空數目 median 中位數mode 眾數std 標準差var 方差cov 協方差ptp 極差skew 樣本偏度 kurt 樣本峰度 sem標準誤差 quantile 四分位數 ...

pandas的資料累計統計分析

本文的主要內容是基於中國大學mooc 慕課中的 python資料分析與視覺化課程進行整理和總結。資料的累計統計分析是能夠對序列中的前n個數進行累計運算，對於一些大量的資料分析中，可以減少for迴圈的使用，也使得資料的運算變得更加靈活。pandas提供了一組資料累計統計分析函式，這些函式都適用於s...

Pandas統計分析基礎之DataFrame

3 更改dataframe中的資料 4 增加dataframe中的資料刪除dataframe中的資料 dataframe類似於資料庫的表或者excel的 panda將資料讀取之後，以dataframe的資料結構儲存在記憶體中。下面就來介紹一下dataframe的增刪查改操作。因為dataframe...

pandas的統計分析

pandas統計分析基礎（2）

pandas的資料累計統計分析

Pandas統計分析基礎之DataFrame

相關推薦