pandas中 value counts 的用法

2022-06-10 01:42:10 字數 1458 閱讀 8128

value_counts()是一種檢視**某列中有多少個不同值的快捷方法,並計算每個不同值有在該列中有多少重複值。

value_counts()是series擁有的方法,一般在dataframe中使用時,需要指定對哪一列或行使用,該函式返回的也是series型別,且index為該列的不同值,values為不同值的個數

1 import pandas as pd

2 import numpy as np

3 filepath='c:\python\data_src\gfscofog_03-05-2018 03-04-36-54_timeseries\gfscofog_cha.csv'

4 data = pd.read_csv(filepath,encoding='utf-8')

資料樣例如下圖所示

2 #輸出

3 percent of gdp 3561

4 domestic currency 3561

5 percent of total expenditure 470

6 name: unit name, dtype: int64

data['sector name'].value_counts()

1 data['sector name'].value_counts()

2 #輸出結果

3 extrabudgetary central government 1020

4 social security funds 1002

5 central government (incl. social security funds) 944

6 budgetary central government 944

7 local governments 944

8 general government 944

9 central government (excl. social security funds) 944

10 state governments 850

11 name: sector name, dtype: int64

pandas中DataFrame mean函式用法

mean 平均數 pandas中的df.mean 函式預設是等價於df.mean 0 即按軸方向求平均,得到每列資料的平均值。相反的df.mean 1 則代表按行方向求平均,得到每行資料的平均值。舉例 我們 首先匯入pandas包 import pandas as pd建立矩陣 首先使用預設方法 會...

Pandas中的分類

一 分類變數的結構 乙個分類變數包括三個部分,元素值 values 分類類別 categories 是否有序 order 從上面可以看出,使用cut函式建立的分類變數預設為有序分類變數 一 獲取分類屬性 a describe方法 該方法描述了乙個分類序列的情況,包括非缺失值個數 元素值類別數 不是分...

Pandas中resample方法詳解

pandas中的resample,重新取樣,是對原樣本重新處理的乙個方法,是乙個對常規時間序列資料重新取樣和頻率轉換的便捷的方法。方法的格式是 dataframe.resample rule how none axis 0 fill method none closed none label non...