python資料分析之pandas學習筆記

2021-10-11 02:10:39 字數 1509 閱讀 3809

import pandas as pd

import numpy as np

from matplotlib import pyplot as plt

from matplotlib import font_manager

plt.rcparams[

'font.sans-serif']=

['simhei'

]# 這句不知什麼意思,有了這句話中文才能全部顯示

my_font = font_manager.fontproperties(fname=

"c:\windows\fonts\msyh.ttf"

)# 讀取本地檔案

file_path =

"e:\python資料來源\豆瓣電影.xlsx"

mv_list = pd.read_excel(file_path)

# 按照電影型別的數量排倒序,給型別畫出條形圖

# 1.電影型別有哪些

mv_type_a = mv_list[

"型別"].

str.split(

",")

.tolist(

)mv_type =

list

(set

([i for j in mv_type_a for i in j]))

# 2.構造全為0的列表

zeros_df = pd.dataframe(np.zeros(

[250

,len

(mv_type)])

,columns=mv_type)

# 3.給每個電影出現分類的位置複製1

for i in

range

(250):

zeros_df.loc[i,mv_type_a[i]]=

1# 統計每個型別的和

type_count = zeros_df.

sum(axis =0)

# 排倒序

type_count = type_count.sort_values(ascending=

false

)_x = type_count.index

_y = type_count.values

# 畫條形圖

plt.figure(figsize=(30

,10),dpi=

120)

plt.bar(

range

(len

(_x)

),_y)

plt.xlabel(

"型別"

,fontproperties=my_font)

plt.ylabel(

"數量"

,fontproperties=my_font)

plt.xticks(

range

(len

(_x)

),_x,fontproperties=myfont)

plt.show(

)

Python之資料分析(寶可夢資料分析)

在此感謝阿里雲天池平台提供的學習平台,並提供相應的教程供小白們學習資料分析。seaborn庫 seaborn 是基於 python 且非常受歡迎的圖形視覺化庫,在 matplotlib 的基礎上,進行了更高階的封裝,使得作圖更加方便快捷。即便是沒有什麼基礎的人,也能通過極簡的 做出具有分析價值而又十...

python資料分析之Numpy

numpy系統是python的一種開源的數值計算擴充套件 ndarray 多維陣列 所有元素必須是相同型別 ndim屬性,維度個數 shape屬性,各維度大小 dtype屬性,資料型別 coding utf 8 import numpy as np 生成指定維度的隨機多維資料 data np.ran...

Python 資料分析之scipy

scipy是一組專門解決科學計算中各種標準問題域的包的集合,主要包括下面這些包 匯入積分模組 import numpy as np 匯入numpy庫 from scipy import integrate 匯入定積分模組scipy.integrate.quad func,a,b 計算單重積分,引數分...