聚類儲存過程分析

2021-09-30 09:07:22 字數 749 閱讀 5417

這個帖子裡的問題

select     tmp1.str1, tmp2.str2

from master.dbo.spt_values left join

(select distinct dense_rank() over (order by str1) as expr1, str1

from tb) as tmp1 on tmp1.expr1 = master.dbo.spt_values.number left join

(select distinct dense_rank() over (order by str2) as expr2, str2

from tb) as tmp2 on tmp2.expr2 = master.dbo.spt_values.number

where master.dbo.spt_values.type = 'p' and master.dbo.spt_values.number <= 5

master.dbo.spt_values這張表裡有從1到2048,type為p的整數

dense_rank() 表示濃度排名,意思是相同的值在排名中只佔乙個位次,有兩人並列第二名,不會造成第三名順延成第四名

master.dbo.spt_values.number <= 5
這句是為了不讓多餘的null 占用空間

最後把tb表放上:

聚類儲存過程分析

這個帖子裡的問題 select tmp1.str1,tmp2.str2 from master.dbo.spt values left join select distinct dense rank over order by str1 as expr1,str1 from tb as tmp1 o...

Canopy聚類演算法過程

前幾天學習canopy演算法,看了上面的流程圖一直不懂,後來對整個流程模擬了一遍,並畫了個圖,才逐漸理解了,現將流程用自己的語言敘述一遍 我們假設每個資料用小圓點來表示。在計算機中用list集合儲存。canopy演算法首先選擇兩個距離閾值 t1和t2,其中t1 t2 1 原始狀態下的資料還沒有分類,...

Canopy聚類演算法分析

canopy聚類演算法是可以並行執行的演算法,資料並行意味著可以多執行緒進行,加快聚類速度,開源ml庫mahout 使用。一 概念 與傳統的聚類演算法 比如 k means 不同,canopy 聚類最大的特點是不需要事先指定 k 值 即 clustering 的個數 因此具有很大的實際應用價值。與其...