挖掘頻繁模式 關聯和相關性 基本概念和方法

2021-07-30 03:08:47 字數 874 閱讀 3016

頻繁模式:

頻繁模式是頻繁地出現在資料集中的模式(如項集、子串行或子結構)。

例如:頻繁地同時出現在交易資料集中的商品(如香皂和洗衣液)的集合是頻繁項集。

序號交易號

香皂(a)

洗髮露(b)

洗衣液(c)

牙膏(d)

簡化表示

1081201

香皂洗髮露

洗衣夜a, b, c

2081202

香皂洗衣夜

牙膏a, c, d

3081203

香皂洗髮露

a, b,

4081204

洗髮露洗衣夜

牙膏b, c, d

5081205

香皂洗髮露

洗衣夜牙膏

a, b, c, d

6081206

香皂洗髮露

洗衣夜牙膏

a, b, c, d

7081207

洗髮露牙膏

b, d

8081208

香皂牙膏

a, b, c, d

9081209

香皂洗髮露

a, d

10081210

香皂洗髮露

牙膏a, b, d

關聯規則:

關聯規則就是描述資料事務屬性專案之間的關聯。

支援度:

支援度就是指定的專案組合集,在資料庫中包含這個專案集的事務數占總數的比例。

置信度:

置信度是在x出現的情況下,y也出現的概率。計算公式為:x和y的支援數/x的支援數。

頻繁專案集:

頻繁專案集就是指專案集的支援度大於人們指定的支援度。

本人初學,敬請指教。

挖掘頻繁模式 關聯和相關性 基本概念和方法

頻繁模式挖掘搜尋給定資料集中反覆出現的聯絡。典型例子 購物籃分析 該過程通過發現顧客放入他們購物籃中的商品之中的關聯,分析顧客的購物習慣。關聯規則 association rule a b support confidence 規則的支援度和置信度是規則興趣度的兩種度量。規則 a b 具有支援度 s...

資料探勘 挖掘頻繁模式 關聯和相關 1

學習是一件很苦的事情,但是有時卻是一件很神奇的事情,神奇到原本很抽象枯燥的知識點你卻可以取其精華的理解,這時效率最高 此時務必將心得寫下 以下讀書筆記來自我在閱讀 資料探勘 概念與技術 的一點感受 所謂挖掘頻繁模式,關聯和相關,即指在出現的資料集中找到乙個經常出現的序列模式或者是乙個經常出現的資料結...

資料探勘系列之三 頻繁模式 關聯和相關

項集的出現頻率 包含項集的事務數。也稱作頻率 支援度計數 計數。記作support count。某項集i的支援度 包含i的事務數 總事務數 置信度 用於產生強關聯規則,參見第2節。對於i的某個子集i support count i support count i 即為置信度的定義。只要得到a,b和a...