Python資料清洗之 統計資料集

2021-10-24 05:27:01 字數 927 閱讀 6811

import os

def count_dir(data_dir, label):

count = 0 # 當前 label 資料夾數量

label_dir = os.path.join(data_dir, label) # 當前遍歷 label 資料夾目錄

for parent, dirs, files in os.walk(label_dir):

if files == :

continue

count += len(files)

return count

def count_all(data_dir):

labels = # data_dir 下19類資料的資料夾名

all = 0

for dir in os.listdir(data_dir): # os.listdir返回資料夾和檔案,只篩選 data_dir 下的資料夾

cur_dir = os.path.join(data_dir, dir)

if os.path.isdir(cur_dir):

print("資料夾\t數量")

# 遍歷 19 類資料的資料夾

for label in labels:

count = count_dir(data_dir, label)

all += count

print("{}\t{}".format(label, count))

print('總數\t{}'.format(all))

def main():

data_dir = r"d:\data\博雲資料集\train_val"

count_all(data_dir)

if __name__ == '__main__':

main()

python分組統計資料 資料分組統計

統計分析資料的時候,經常需要進行分組統計。分組操作在python裡的實現方式就是groupby語句。慣例,咱們先造乙個dataframe表。import pandas as pd dic 結果為 math physics science class a 77.0 176 88 b 38.5 100 ...

分組統計資料

with a as select convert varchar 10 starttime,120 starttime,case when organid like 0226 then else 非 end as deptname,sum case when billableseconds 0 th...

oracle查詢統計資料

oracle 按每天,每週,每月,每季度,每年查詢統計資料 按天統計 select count dataid as 每天運算元量,sum from tablename group by trunc createtime,dd 按自然周統計 select to char date,iw sum fro...