分析apriori 演算法的 trie實現

簡單來說trie 就是乙個 ordered tree 排列依據可以是 alpha 也可以是數值。並且是遞迴的。這樣的方式即可以大量壓縮同字首的串，也可以可容易作到子樹的融合。生成apiori的candidate 與接下來的刪枝就可以在乙個樹上做了。演算法和**，****是《a fast apriori implementation》 ferenc bodon。本來他在另一片文章中說，資料庫讀入記憶體後也用trie來存的這樣在每次生成k-item 之後就可以刪減樣本資料庫的大小了，可是因為lack of time 就麼有做了-_-! 嗯，怎麼說呢，這就是學校的科研啊，出**是王道啊，實現？咳咳，該招個研究生了吧？

我之所以又回頭看看這個實現是因為跟同學聊天到現在市面上已經有了 2t 記憶體 3t硬碟的筆記本了，進xp 是瞬間。差不多1萬刀。那麼硬體那麼賤價了拿來幹什麼好呢？那就算東西吧！以前在** bureaucracy 或者大學才有能力做的大規模資料分析工作，現在乙個hacker在家也能倒弄了。1萬刀雖然貴但是比小型機可是便宜太多了。設想一下，拿乙個t來存資料庫的trie ，設資料壓比例達到十，（如果是人名的話不希奇）那就有10995116277760byte 也就是說能存下1萬億個字，做什麼分析都行了。。。那麼從這個角度而言，計算機的發展的侷限也就越來越體現在軟體上了。。。。

our apriori implementation can be further improved

if trie is used to store reduced basket, and a reduced basket

is removed if it does not contain any candidate.

分析apriori 演算法的 trie實現

Apriori演算法關聯分析

關聯分析的Apriori演算法 in Python

關聯分析演算法Apriori介紹

分析apriori 演算法的 trie實現

Apriori演算法 關聯分析

關聯分析的Apriori演算法 in Python

關聯分析演算法Apriori介紹

相關推薦

Apriori演算法關聯分析