找出資料集中出現樣本個數最多與最少的10個類別

2021-09-22 01:52:50 字數 976 閱讀 4307

前面我們通過視覺化手段看到每個類別中訓練集數量是不均勻的,我們需要將數目最多和最少的10個類別找出來,進行相應的處理!**實現如下:

import sys, os, multiprocessing, urllib3, csv

from pil import image

from io import bytesio

from tqdm import tqdm

import json

from collections import counter

import matplotlib.pyplot as plt

import numpy as np

from numpy import *

import pylab

import heapq

urllib3.disable_warnings(urllib3.exceptions.insecurerequestwarning)

key_class_list =

count = {}

j = json.load(open('train.json'))

images = j['images']

for item in images:

label = item['class']

print(type(key_class_list),'\n',len(key_class_list)) #列印出來資料資訊(型別,長度)

#統計列表中最多最少的10數

print(counter(key_class_list).most_common(10))

print(counter(key_class_list).most_common()[:-11:-1])

列印結果如下:

找出陣列中出現次數最多的那個數 主元素問題

方法一 以空間換時間,可以定義乙個計數陣列int count 100 用來對陣列中數字出現的次數進行計數 只能針對陣列中數字的範圍1 1000 count陣列中最大的元素對應的下標,即為出現次數最多的那個數。如下 include using namespace std int main int co...

找出乙個陣列中出現次數最多的那個元素

description 找出乙個陣列中出現次數最多的那個元素 input 多組輸入,請處理到檔案結束 每組第一行輸入乙個整數n 不大於20 第二行輸入n個整數 output 找出n個整數中出現次數最多的那個整數,資料保證答案唯一 sample input 41 2 2 3 sample output...

找出出現次數最多的幾個數值

這道題目所說的出現最多的幾個數值,其實是帶有附加條件的 這幾個數值中出現次數最少的那個數,要比除這幾個值外的其他數的總個數要多。說的自己都有點暈 這樣才能在最後結果中,呈現這幾個數。所以必須按照資料來源中的統計量分析出求前幾位的數值。其 如下 include include using namesp...