pandas的統計分析

2021-10-02 02:31:31 字數 2064 閱讀 8592

import pandas as pd

import numpy as np

data = pd.read_excel("./meal_order_detail.xlsx")

print(『data:\n』, data)

print(『data 的列索引:\n』, data.columns)

print(『data 的資料型別:\n』, data.dtypes)

print(』*』 * 100)

print(『amounts counts 列的最小值:\n』,data.loc[:,[『amounts』,『counts』]].min())

print(type(data.loc[:,[『amounts』,『counts』]].min())) #

#對 amounts 進行統計指標

#print(『amounts 列 最小值:\n』, data.loc[:, 『amounts』].min())

#print(『amounts 列 最大值:\n』, data.loc[:, 『amounts』].max())

print(『amounts 列 均值:\n』, data.loc[:, 『amounts』].mean())

#print(『amounts 列 方差:\n』, data.loc[:, 『amounts』].var())

#print(『amounts 列 標準差:\n』, data.loc[:, 『amounts』].std())

#print(『amounts 列 極差:\n』, data.loc[:, 『amounts』].ptp())

#print(『amounts 列 非空數值的數量:\n』, data.loc[:, 『amounts』].count())

#print(『cost 列 非空數值的數量:\n』, data.loc[:, 『cost』].count())

#print(『amounts 列最大值的下標:\n』, data.loc[:, 『amounts』].idxmax()) # np.argmax

#print(『amounts 列最小值的下標:\n』, data.loc[:, 『amounts』].idxmin()) # np.argmin

#print(『amounts 列的眾數 為:\n』,data.loc[:,『amounts』].mode())

#print(『amounts 列的眾數 為的型別為:\n』,type(data.loc[:,『amounts』].mode()))

#print(『dishes_name 列的眾數為:\n』,data.loc[:,『dishes_name』].mode())

#print(『amounts 列的中位數:\n』,data.loc[:,『amounts』].median())

#print(『amounts 列的分位數:\n』,data.loc[:,『amounts』].quantile())

#print(『amounts 列的分位數:\n』, data.loc[:, 『amounts』].quantile(q=np.arange(0, 1 + 1 / 4, 1 / 4)))

#print(『amounts 列的分位數:\n』, data.loc[:, 『amounts』].quantile(q=np.arange(0, 1 + 1 / 5, 1 / 5)))

#分位數–min 25% 50% 75% max

#對 amounts 列進行 describe描述

#print(『amounts 列進行describe 描述:\n』,data.loc[:,『amounts』].describe())

#data.loc[:, 『dishes_name』] = data.loc[:, 『dishes_name』].astype(『category』)

data.loc[:, 『dishes_name』] = data.loc[:, 『dishes_name』].astype(『object』)

print(『dishes_name 列的describe 描述:\n』, data.loc[:, 『dishes_name』].describe())

print(『data 的資料型別:\n』,data.dtypes)

pandas統計分析基礎(2)

pandas描述性統計方法的常見方法 方法統計含義 方法統計含義 min最小值 max最大值 mean 均值count 非空數目 median 中位數mode 眾數std 標準差var 方差cov 協方差ptp 極差skew 樣本偏度 kurt 樣本峰度 sem標準誤差 quantile 四分位數 ...

pandas的資料累計統計分析

本文的主要內容是基於中國大學mooc 慕課 中的 python資料分析與視覺化 課程進行整理和總結。資料的累計統計分析是能夠對序列中的前n個數進行累計運算,對於一些大量的資料分析中,可以減少for迴圈的使用,也使得資料的運算變得更加靈活。pandas提供了一組資料累計統計分析函式,這些函式都適用於s...

Pandas統計分析基礎之DataFrame

3 更改dataframe中的資料 4 增加dataframe中的資料 刪除dataframe中的資料 dataframe類似於資料庫的表或者excel的 panda將資料讀取之後,以dataframe的資料結構儲存在記憶體中。下面就來介紹一下dataframe的增刪查改操作。因為dataframe...