應用Orange進行購物籃分析2009 12 16

2021-09-09 04:37:23 字數 1102 閱讀 9813

隨著網路零售業被消費者認同的程度逐漸加大,規模不斷擴張,乙個零售**上面的商品種類也越來越豐富,這時顧客所需要處理的資訊量就會急劇增加。

phillips(2005)的研究表明,當顧客面對種類繁多的商品時,並不會因為可選擇的豐富多樣性而得到更多的滿足,但是他們能夠因為賣家對其商品選擇的引導而感到滿意。對於零售購物**來說,引導顧客的乙個有效的辦法就是合理的網頁布局,就是說,哪些商品應該放置在一起,哪些商品應該被放置在醒目的位置,或進行推薦。

顧客的購買行為是一種整體行為,他們很少單買一種商品,而往往是多種商品的組合,而這些商品是密切相關的。一件商品的買與不買,買多與買少,都會直接影響其他商品的購買,影響每個購物籃的利潤。因此,消費者的購物籃隱含著重要並且有價值的資訊,等待人們去發掘。如商家可以通過購物籃分析來了解消費者的購買習慣、產品偏好、品牌忠誠度等。

目標

做產品的關聯推薦,希望通過dm來找出產品購物潛在的關係,向使用者推薦同時購買機率大的產品,促進關聯產品的銷售,提供整體的銷售量

問題定義

資料樣本

對2023年12月15日的***條記錄作為樣本進行分析(未進行去躁處理),這***條記錄來自yyyy個訂單

工具

orange需要的py庫比較多,由於要下對版本,單獨安裝比較繁瑣,還好它提供了打包的版本,大家可以看一下

official site:

snapshot of orange with python 2.5 and required libraries

2.5的版本是穩定版本,還有乙個不穩定的2.6版本

如果你之前有裝其它版本的python需要做一下處理,在要更改環境變數到合適的版本

主要利用orange進行association rules的使用,有乙個比較擔心的問題是,資料庫大了之後會吃不住,因為使用的是apriori algorithm

反正是做demo,follow me.

**參見此處

購物籃模型 Apriori演算法

一 頻繁項集若i是乙個項集,i的支援度指包含i的購物籃數目,若i的支援度 s,則稱i是頻繁項集。其中,s是支援度閾值。1 應用 2 關聯規則i j 如果i中所有項出現在某個購物籃的話,那麼j 有可能 也出現在這一購物籃中。i j的可行度 集合i與補集的支援度與i的支援度的比值。在實際應用中,購物籃規...

購物籃演算法的理解 基於R的應用

是無監督機器學習方法,用於知識發現,而非 無需事先對訓練資料進行打標籤,因為無監督學習沒有訓練這個步驟。缺點是很難對關聯規則學習器進行模型評估,一般都可以通過肉眼觀測結果是否合理。一,概念術語 1,項集itermset 如上每個內的都稱為乙個項集,lhs,rhs成為左右項集,他們之間不能有重複值交集...

R語言與關聯規則挖掘 購物籃分析

名詞 挖掘資料集 購物籃資料 挖掘目標 關聯規則 關聯規則 啤酒 尿布 支援度0.02,置信度0.6 支援度 所有資料中有2 的購物記錄包含了啤酒和尿布 置信度 所有包含啤酒的購物記錄裡有60 包含尿布 最小支援度閾值和最小置信度閾值。項集 項 商品 組成的集合 k 項集 k個項組成的集合 頻繁項集...