統計分析 關聯規則之置信度,支援度,提公升度

2021-08-28 00:09:00 字數 2225 閱讀 1616

別看這幾個公式不起眼,資料分析倒是用的很普遍,所以最好記住啊,記不住也沒關係,我都總結好了

一般使用三個指標來度量乙個關聯規則,根據這三個指標可以篩選出滿足條件的關聯規則。

這三個指標是:sup

port

(支援度

)support(支援度)

suppor

t(支援

度)、c on

fide

nce(

置信度)

confidence(置信度)

confid

ence

(置信度

)、lift

(提公升度

)lift(提公升度)

lift(提

公升度)。

以x ,y

x,yx,

y這個關聯規則為例來說明:

先驗前提:x,y

x,yx,

y表示為商品,現有一商場,統計一天內的訂單小票。

表示同時購買x、y

x、yx、

y的訂單數佔總訂單數(研究關聯規則的「長表」中的所有購買的產品的訂單數)的比例。如果用p(x

)p(x)

p(x)

表示購買x

xx的訂單比例,其他產品類推,那麼

s up

port

(x,y

)=p(

x,y)

p(al

l)=同

時購買的

訂單數總

訂單

數support(x,y) = \frac=\frac的訂單數}

suppor

t(x,

y)=p

(all

)p(x

,y)​

=總訂單

數同時購

買的訂單

數​表示購買x

xx的訂單中同時購買y

yy的比例,即同時購買x

xx和y

yy的訂單數佔購買x

xx的訂單的比例。公式表達:

c on

fide

nce(

x−

>y)

=p(y

/x)=

p(x,

y)p(

x)=同

時購買的

訂單數購

買x的訂

單數

confidence(x->y) =p(y/x) =\frac=\frac的訂單數}

confid

ence

(x−>y)

=p(y

/x)=

p(x)

p(x,

y)​=

購買x的

訂單數同

時購買的

訂單數​co

nfid

ence

(y

−>x)

=p(x

/y)=

p(x,

y)p(

y)=同

時購買的

訂單數購

買y的訂

單數

confidence(y->x) =p(x/y) =\frac=\frac的訂單數}

confid

ence

(y−>x)

=p(x

/y)=

p(y)

p(x,

y)​=

購買y的

訂單數同

時購買的

訂單數​

l if

t(x−

>y)

=p(x

,y)p

(x)p

(y)=

p(y/

x)p(

y)=同

時購買的

訂單數×

總訂單數

購買x的

訂單數×

購買y的

訂單

數lift(x->y) =\frac =\frac=\frac的訂單數\times總訂單數}

lift(x

−>y)

=p(x

)p(y

)p(x

,y)​

=p(y

)p(y

/x)​

=購買x

的訂單數

×購買y

的訂單數

同時購買

的訂單數

×總訂單

數​

計算**見:

關聯分析中的支援度 置信度和提公升度

自 1.支援度 support 支援度表示項集在總項集裡出現的概率。公式為 support x y p x,y p i p x y p i num xuy num i 其中,i表示總事務集。num 表示求事務集裡特定項集出現的次數。比如,num i 表示總事務集的個數 num x y 表示含有的事務...

關聯分析中的支援度 置信度和提公升度

1.支援度 support 支援度表示項集在總項集裡出現的概率。公式為 support x y p x,y p i p x y p i num xuy num i 其中,i表示總事務集。num 表示求事務集裡特定項集出現的次數。比如,num i 表示總事務集的個數 num x y 表示含有的事務集的...

R關聯規則演算法(支援度 自信度 提公升度)

用於大量資料中挖掘出有價值的資料項之間的相關關係 常用於使用者購物籃分析,使用它來發現顧客的購買習慣 兩個不相交的非空集合x y,如果有x y,就說x y是一條關聯規則。關聯規則的強度用支援度 support 和自信度 confidence 來描述,關聯規則是否可用,使用提公升度 lift 來描述。...