Pandas資料分析實戰04

2021-10-19 11:02:37 字數 2507 閱讀 2917

統計以下5個國家2023年人口的佔比情況:

country_list = [「afghanistan」,「albania」,「arab world」,「aruba」,「bangladesh」]

import numpy as np

import pandas as pd

import matplotlib.pyplot as plt

plt.rcparams[

'font.sans-serif']=

['simhei'

] plt.rcparams[

'axes.unicode_minus']=

false

# 設定檔名稱

file_name =

"population_data.json"

# 設定檔案路徑

file_path =

"d:\\coding\\python\\logiccoding\\data analyze\\"

# 用pandas讀取及合併json檔案

df_population = pd.read_json(file_path + file_name)

df_population

df_population.info(

)

# 統計以下5個國家2023年人口的佔比情況

country_list =

["afghanistan"

,"albania"

,"arab world"

,"aruba"

,"bangladesh"

]# 依次統計各國2023年的人口佔比情況

# 方法一,使用布林索引篩選國家和篩選年份,最後將對應的值新增到列表中

country_population =

for country in country_list:

df_pop = df_population[

(df_population[

"country name"

]== country)

&(df_population[

"year"]==

2010)]

df_pop = df_pop.reset_index()0

,"value"

].astype(

float))

country_population

# 方法二,用loc()方法實現快速定位

country_population =

for country in country_list:

df_pop = df_population.loc[

(df_population[

"country name"

]== country)

&(df_population[

"year"]==

2010)]

df_pop = df_pop.reset_index()0

,4].astype(

float))

country_population

# 繪製餅圖

defdraw_pie()

: plt.pie(country_population

,labels = country_list # 各個部分的名字(標籤)

,labeldistance =

1.1# 標籤到中心點的距離

,autopct =

'%.1f%%'

# 控制比例的值的顯示

,pctdistance =

0.5# 控制百分比的值的顯示位置

,explode =[0

,0,0.1,0

,0]# 每乙份扇形 到中心點的距離

,colors =

['yellow'

,'blue'

,'red'

,'orange'

,'green'

],shadow =

true

,startangle =

90# 繪製圖形時候 開始的角度

) plt.title(

"各國2023年人口的佔比情況"

Pandas資料分析實戰03

讀取北上廣深瓜子二手車的資料 1.分別讀取4個csv檔案,然後合併多個csv檔案 2.去重複資料,重新設定連續索引 3.統計汽車自動擋和手動擋分別有多少輛 4.統計哪個城市二手車數量最多 5.統計深圳市最多的二手車品牌 瓜子網二手車交易資料 import numpy as np import pan...

資料分析 pandas

pandas是乙個強大的python資料分析的工具包,它是基於numpy構建的,正因pandas的出現,讓python語言也成為使用最廣泛而且強大的資料分析環境之一。pandas的主要功能 具備對其功能的資料結構dataframe,series 整合時間序列功能 提供豐富的數 算和操作 靈活處理缺失...

python資料分析 Pandas

import pandas as pd series 可以看做乙個定長的有序字典。基本任意的一維資料都可以用來構造 series 物件 s pd.series 1,2,3.0,abc s1 pd.series data 1,3,5,7 index a b x y 通過下標獲取資料 s1 a seri...