聚類演算法文件(業務程序 業務URL)

2021-06-28 04:43:45 字數 657 閱讀 3529

假設:

終端=4000;業務軟體程序=100;url=16000;

第i個終端包含xi個不同業務軟體程序,包含yi個url。

該演算法關鍵是需要將業務程序名集和url程序名集轉換成數值相似性集合,便於聚類分析。

1、             首先將終端與對應的業務軟體程序集作關聯性分析;

第i個終端業務程序名數=ki(process_1,…,process_ki),該終端權重=ki/100,分析每個終端與其他終端之間的關聯性(兩個終端之間使用相同程序名的重合度*權重)。首先分析終端1與終端2…終端4000之間的關聯性,依次迭代計算終端之間的關聯性,最後形成終端與使用業務軟體程序之間的關聯度數值矩陣4000*4000。

2、             將終端與url程序集作關聯性分析;

第i個終端訪問url數=mi(url_1,…,url_mi),該終端權重=mi/16000,分析每個終端與其他終端之間的關聯性(兩個終端之間使用相同程序名的重合度*權重)。首先分析終端1與終端2…終端4000之間的關聯性,依次迭代計算終端之間的關聯性,最後形成終端與使用業務軟體程序之間的關聯度數值矩陣4000*4000。

3、             將兩個關聯性數值矩陣組合形成4000*8000的矩陣;

4、             根據這個矩陣採用聚類演算法進行終端相似性聚合。

排名 rank 演算法文件集合

看到乙個系列文章,值得好好研究一下。基於使用者投票的排名演算法 一 delicious和hacker news 基於使用者投票的排名演算法 二 reddit 基於使用者投票的排名演算法 三 stack overflow 基於使用者投票的排名演算法 四 牛頓冷卻定律 基於使用者投票的排名演算法 五 威...

聚類演算法 近鄰聚類演算法

time is always too short for those who need it,but for those who love,it lasts forever.dracula untold 近鄰聚類法同樣是一種基於距離閾值的聚類演算法。coding utf 8 近鄰聚類演算法的pyth...

聚類演算法 層次聚類演算法

層次聚類演算法 hierarchical clustering method 又稱為系統聚類法 分級聚類法。層次聚類演算法又分為兩種形式 凝聚層次聚類 首先將每個物件作為乙個簇,然後合併這些原子簇為越來越大的簇,直到某個終結條件被滿足。層次聚類 首先將所有物件置於乙個簇中,然後逐漸細分為越來越小的簇...