Python Pandas的apply函式使用示例

資料大致是這個樣子：

美國人口普查資料

以每個州人口最多的 3 個縣的人口總和為這個州人口的衡量標準，哪 3 個州人口最多？

在 2010 年至 2015 年間人口變化幅度最大的是哪個縣？

先按州分組，再對每個州內的縣進行排序選出人口最多的 3 個縣求和，作為每個州的人口數，最後排序。

對於每個縣，計算 2010-2015 年的人口數的最大值和最小值，求出差值即變化幅度，再對差值進行排序找出變化幅度最大的縣。

census_df = pd.read_csv('census.csv')
only_county = census_df[census_df['sumlev'] == 50]
deftop
(df, n=3, column='census2010pop'):
return df.sort_values(column, ascending=false)[:n]['census2010pop'].sum()
grouped.sort_values(ascending=false)[:3].index.tolist()

輸出：

census_df = pd.read_csv('census.csv')
only_county = census_df[census_df['sumlev'] == 50]
defget_change
(row):
pop_year = row[['popestimate2010', 
'popestimate2011', 
'popestimate2012', 
'popestimate2013', 
'popestimate2014', 
'popestimate2015']]
return pop_year.max() - pop_year.min()

輸出：

餃子大人的Python Pandas

我假設你已經有了一定的python基礎，而是在日常的使用中為不知道某個函式的功能而發愁的小夥伴。以下是我總結分享出numpy的一些函式的使用方法。希望能夠幫助到大家。如果您覺得我分享的內容對您有點幫助的話，請點贊收藏吧。肯定有錯，當然不全，但按你胃 anyway 成長的路上就是要不斷的犯錯。部落格中...

Python pandas，建立Series型別

numpy只能處理數值型別的資料。pandas除了可以處理數值型別外，還可以處理非數值型別的資料例如字串時間序列等 pandas常用的資料型別 series 一維，帶標籤的陣列，對應資料庫中的一條記錄 dataframe 二維，series容器，對應資料庫中的表 demo.py series的...

python pandas使用記錄

在使用numpy中array格式的矩陣時，我們通常使用如a 2 4,5 10 獲取陣列中一部分資料，但是dataframe結構的陣列就不能這麼寫，可以使用iloc方法，即index locate,另外有個相似的方法loc,這個方法是通過column名字進行資料定位的 import pandas as...

Python Pandas的apply函式使用示例

餃子大人的Python Pandas

Python pandas，建立Series型別

python pandas使用記錄

相關推薦