GSP序列模式演算法

2021-08-18 12:38:17 字數 522 閱讀 7657

參考文獻:

gsp:gsp演算法是序列模式挖掘演算法的一種,他是一種類apriori的一種,整個過程與apriori演算法比較類似,不過在細節上會略有不同,在下面的描述中,將會有所描述。gsp在原有的頻繁模式定義的概念下,增加了3個的概念。

1、加入時間約束min_gap,max_gap,要求原來的連續變為只要滿足在規定的min_gap到max_gap之間即可。

2、加入time_windows_size,只要在windows_size內的item,都可以被認為是同一itemset。

3、加入分類標準。

以上3點新的中的第一條特徵將會在後面的演算法中著重展現。

1、根據所輸入的序列,找出所有的單項集,即1頻繁模式,這裡會經過最小支援度閾值的判斷。

2、根據1頻繁模式進行連線運算,產生2頻繁模式,這裡會有進行最小閾值的判斷。

3、根據2頻繁模式連線產生3頻繁模式,會經過最小支援度判斷和剪枝操作,剪枝操作的原理在於判斷他的所有子集是否也全是頻繁模式。

4、3頻繁模式不斷的挖掘知道不能夠產生出候選集為止。

序列模式PrefixSpan演算法

與gsp一樣,prefixspan演算法也是序列模式分析演算法的一種,不過與gsp演算法不同的是prefixspan演算法不產生任何的侯選集,在這點上可以說已經比gsp好很多了。prefixspan演算法可以挖掘出滿足閾值的所有序列模式,可以說是非常經典的演算法。prefixspan演算法的全稱是p...

不可變序列演算法 可變序列演算法

search演算法 在乙個序列中搜尋與另一串行匹配的子串行。引數分別為乙個序列的開始位置,結束位置和另乙個序列的開始,結束位置。函式原型 search v1.begin v1.end v2.begin v2.end search n演算法 重複元素子串行搜尋search n 函式搜尋序列中是否有一系...

演算法 單峰序列

問題描述 給定含有n個不同整數的陣列l 如果l中存在ai,使得a1ai 1 an。則稱l是單峰的,並稱ai是l的 峰頂 假設l是單峰的,設計乙個演算法,找l的峰頂。輸入形式 一共包括兩行,第一行乙個整數n,表示陣列中整數的個數。接下來的一行中包含n個整數,以空格分隔 輸出形式 如果這些整數中存在峰頂...