Python Pandas的apply函式使用示例

2021-08-13 23:04:38 字數 1042 閱讀 3974

資料大致是這個樣子:

美國人口普查資料

以每個州人口最多的 3 個縣的人口總和為這個州人口的衡量標準,哪 3 個州人口最多?

在 2010 年至 2015 年間人口變化幅度最大的是哪個縣?

先按州分組,再對每個州內的縣進行排序選出人口最多的 3 個縣求和,作為每個州的人口數,最後排序。

對於每個縣,計算 2010-2015 年的人口數的最大值和最小值,求出差值即變化幅度,再對差值進行排序找出變化幅度最大的縣。

census_df = pd.read_csv('census.csv')

only_county = census_df[census_df['sumlev'] == 50]

deftop

(df, n=3, column='census2010pop'):

return df.sort_values(column, ascending=false)[:n]['census2010pop'].sum()

grouped.sort_values(ascending=false)[:3].index.tolist()

輸出:

census_df = pd.read_csv('census.csv')

only_county = census_df[census_df['sumlev'] == 50]

defget_change

(row):

pop_year = row[['popestimate2010',

'popestimate2011',

'popestimate2012',

'popestimate2013',

'popestimate2014',

'popestimate2015']]

return pop_year.max() - pop_year.min()

輸出:

餃子大人的Python Pandas

我假設你已經有了一定的python基礎,而是在日常的使用中為不知道某個函式的功能而發愁的小夥伴。以下是我總結分享出numpy的一些函式的使用方法。希望能夠幫助到大家。如果您覺得我分享的內容對您有點幫助的話,請點贊收藏吧。肯定有錯,當然不全,但按你胃 anyway 成長的路上就是要不斷的犯錯。部落格中...

Python pandas,建立Series型別

numpy只能處理數值型別的資料。pandas除了可以處理數值型別外,還可以處理非數值型別的資料 例如 字串 時間序列等 pandas常用的資料型別 series 一維,帶標籤的陣列,對應資料庫中的一條記錄 dataframe 二維,series容器,對應資料庫中的表 demo.py series的...

python pandas使用記錄

在使用numpy中array格式的矩陣時,我們通常使用如a 2 4,5 10 獲取陣列中一部分資料,但是dataframe結構的陣列就不能這麼寫,可以使用iloc方法,即index locate,另外有個相似的方法loc,這個方法是通過column名字進行資料定位的 import pandas as...