資料分析(Python)貢獻度分析 帕累託法則

2021-10-07 21:07:43 字數 1446 閱讀 4087

在任何特定群體中,重要的因子通常只佔少數,而不重要的因子則占多數,因此只要能控制具有重要性的少數因子即能控制全域性。

資料展示

**實現

#-*- coding: utf-8 -*-

#菜品盈利資料 帕累託圖

from __future__ import print_function

import pandas as pd

#初始化引數

dish_profit =

'dish.xls'

#餐飲菜品盈利資料

data = pd.read_excel(dish_profit, index_col = u'菜品id'

)data = data[u'盈利'

].copy(

)data = data.sort_values(ascending =

false

)#逆序排序

import matplotlib.pyplot as plt #匯入影象庫

plt.rcparams[

'font.sans-serif']=

['simhei'

]#用來正常顯示中文標籤

plt.rcparams[

'axes.unicode_minus']=

false

#用來正常顯示負號

plt.figure(

)data.plot(kind=

'bar'

)plt.ylabel(u'盈利(元)'

)p =

1.0*data.cumsum(

)/data.

sum(

)p.plot(color =

'r', secondary_y =

true

, style =

'-o'

,linewidth =2)

plt.annotate(

format

(p[6],

'.4%'

), xy =(6

, p[6]

), xytext=(6

*0.9

, p[6]

*0.9

), arrowprops=

dict

(arrowstyle=

"->"

, connectionstyle=

"arc3,rad=.2"))

#新增注釋,即85%處的標記。這裡包括了指定箭頭樣式。

plt.ylabel(u'盈利(比例)'

)plt.show(

)

帕累託圖展示

python貢獻度分析以及相關性分析小例子

貢獻度又稱帕累託,80 的利潤來自20 的最暢銷的產品,而其他80 的產品只產生了20 的利潤。coding utf 8 菜品盈利資料 帕累託圖 from future import print function import pandas as pd 初始化引數 dish profit e pyt...

python資料分析

以網路爬蟲為例,網路爬蟲是乙個自動提取網頁的程式,爬蟲是搜尋引擎的第一步,也是最容易的一部。網頁搜尋,建立索引,查詢排序 用c c 效率高,速度塊,適合通用搜尋引擎做往往爬取。但是它的缺點也特別明顯 開發慢,寫起來又臭又長的。而python無論在資料分析還是在指令碼自動化編寫尚都是簡單,易學的。良好...

python資料分析

陣列間的算術運算 npwhere pandas的使用 np.random.rand 3,4 產生乙個3行4列的矩陣 0 1之間的 in 32 data1 1,2,3,4.0 in 34 arr1 np.array data1 in 35 arr1 out 35 array 1.2.3.4.in 37...