pandas練習02 資料過濾與排序

2021-10-08 04:31:54 字數 1728 閱讀 5762

euro2012_stats.csv

1.將資料集命名為euro12

import pandas as pd

import numpy as np

path = './data/euro2012.csv'

# 將資料集命名為euro12

euro12 = pd.read_csv(path)

2.只選取 goals 這一列]

# 只選取 goals 這一列

euro12['goals'].head()

3.有多少球隊參與了2012歐洲盃?

# 有多少球隊參與了2012歐洲盃?

len(np.unique(euro12['team']))

4.該資料集中一共有多少列(columns)?

# 該資料集中一共有多少列(columns)?

len(euro12.columns)

5.將資料集中的列team, yellow cards和red cards單獨存為乙個名叫discipline的資料框

# 將資料集中的列team, yellow cards和red cards單獨存為乙個名叫discipline的資料框

discipline = euro12[['team', 'yellow cards', 'red cards']]

discipline.head()

6.對資料框discipline按照先red cards再yellow cards進行排序

# 對資料框discipline按照先red cards再yellow cards進行排序

discipline.sort_values(['red cards', 'yellow cards'], ascending=false)

7.計算每個球隊拿到的黃牌數的平均值

# 計算每個球隊拿到的黃牌數的平均值

euro12['yellow cards'].mean()

8.找到進球數goals超過6的球隊資料

# 找到進球數goals超過6的球隊資料

euro12[euro12['goals']>6]

9.選取以字母g開頭的球隊資料

# 選取以字母g開頭的球隊資料

euro12[euro12['team'].str.startswith('g')]

10.選取前7列

# 選取前7列

euro12.iloc[:,:7]

11.選取除了最後3列之外的全部列

# 選取除了最後3列之外的全部列

euro12.iloc[:,:-3]

12.找到英格蘭(england)、義大利(italy)和俄羅斯(russia)的射正率(shooting accuracy)

# 找到英格蘭(england)、義大利(italy)和俄羅斯(russia)的射正率(shooting accuracy)

country = euro12['team'].isin(['england', 'italy', 'russia'])

euro12[country][['team', 'shooting accuracy']]

pandas 一 資料過濾與排序

import pandas as pd 在df中取某列,比如name df.name df name 取多列 df name age 計數df.name.count 檢視df資訊,info df.info 檢視有多少列 df.shape 1 檢視多少行 df.shape 0 排序,以values排序...

pl sql 過濾,排序,帥選資料小練習02

1.查詢工資大於12000的員工的姓名和工資 select last name,salary from employees where salary 12000 2,查詢員工工號為176的員工的姓名和部門 select last name,department id from employees w...

02 Pandas 資料結構

pandas 處理以下三個資料結構 這些資料結構構建在 numpy 陣列之上,這意味著它們很快。考慮這些資料結構的最好方法是,較高維資料結構是其較低維資料結構的容器。例如,dataframe是series的容器,panel是dataframe的容器。資料結構 維數描述系列1 1d 標記均勻陣列,大小...