Pandas資料分析初學 資料分組

2021-10-23 06:37:34 字數 989 閱讀 4275

首先匯入pandas庫

import pandas as pd
(1)將資料框命名為drinks;

drinks = pd.read_csv(

'drinks.csv'

)

(2)哪個大陸(continent)平均消耗的啤酒(beer)更多?

(drinks[

['continent'

,'beer_servings']]

.groupby(by=

['continent'])

.mean(

).sort_values(by=

['beer_servings'],

ascending =

false))

.head(

1)

(3)列印出每個大陸(continent)的紅酒消耗(wine_servings)的描述性統計值;

drinks.groupby(

'continent'

).wine_servings.describe(

)

(4)列印出每個大陸每種酒類別的消耗平均值;

drinks.groupby(

'continent'

).mean(

)

(5)列印出每個大陸每種酒類別的消耗中位數;

drinks.groupby(

'continent'

).median(

)

(6)列印出每個大陸對spirit_servings飲品消耗的平均值,最大值和最小值。

drinks.groupby(

'continent'

).spirit_servings.describe(

)

Pandas資料分析初學 Apply函式

首先匯入pandas庫 import pandas as pd 1 將資料框命名為crime 因為這個表中的資料有不同,所以需要將col 0的列設為index crime pd.read csv us crime rates 1960 2014.csv index col 0 2 每一列 colum...

資料分析 pandas

pandas是乙個強大的python資料分析的工具包,它是基於numpy構建的,正因pandas的出現,讓python語言也成為使用最廣泛而且強大的資料分析環境之一。pandas的主要功能 具備對其功能的資料結構dataframe,series 整合時間序列功能 提供豐富的數 算和操作 靈活處理缺失...

資料分析讀取資料pandas

首先安裝完numpy之後就可以安裝pandas了 pip insert pandas 下面是簡單的用法可讀取任何檔案資料報括資料庫 import pandas as pd 通常用pd作為pandas的別名 s pd.series 1,2,3 index a b c 建立乙個序列s d pd.data...