例子 統計電影型別的個數,以及用bar繪製出來表示

2022-09-13 04:15:09 字數 1310 閱讀 9160

import pandas as pd

import numpy as np

from matplotlib import pyplot as plt

#獲取各種電影型別的數量

file='./imdb-movie-data.csv'

data=pd.read_csv(file)

genre=data['genre']

genre_list=genre.str.split(',').tolist()

#轉為一維,轉為集合去重,看有哪些條目

genre_set=set([i for item in genre_list for i in item])

print(genre_list)

#建立乙個帶有索引全為0的二維陣列

inform=pd.dataframe(np.zeros((data.shape[0],len(genre_set))),columns=list(genre_set)) #獲取行數,列數,索引應該為list(列表)型別

#對data【genre】一行一行的遍歷

for i in range(data.shape[0]):

inform.loc[i,genre_list[i]]=1

#計算每一列的和

sum_genre=inform.sum(axis=0)

#排序sum_sort=sum_genre.sort_values()

print(len(sum_sort))

#畫圖plt.figure(figsize=(20,10))

統計電影的型別

給出一電影檔案,算出電影genre的電影型別。coding utf 8 import pandas as pd from matplotlib import pyplot as plt import numpy as np file path imdb movie data.csv df pd.re...

Linux統計資料夾中檔案個數以及目錄個數

首先,你要明白輸入ls l命令吧,檢視某個目錄下面的檔案,執行一下大概是這樣子的,如下所示 執行ls l命令控制台輸出的結果是一行一行,每一行對應乙個目錄或者是檔案。如果是檔案的話,該行的字串資訊的第乙個字元顯示的是 如果是目錄的話,該行的字元的第乙個顯示的是 d 意即directory,找到這兩者...

Linux統計資料夾中檔案個數以及目錄個數

首先,你要明白輸入ls l命令吧,檢視某個目錄下面的檔案,執行一下大概是這樣子的,如下所示 執行ls l命令控制台輸出的結果是一行一行,每一行對應乙個目錄或者是檔案。如果是檔案的話,該行的字串資訊的第乙個字元顯示的是 如果是目錄的話,該行的字元的第乙個顯示的是 d 意即directory,找到這兩者...