關於《深入推薦引擎相關演算法聚類》文章學習感悟

查詢資料發現很多**都引用了《深入推薦引擎相關演算法 - 聚類》這篇文章，裡面關於聚類相關演算法的調用作了詳細的介紹；但是這篇文章引用的mahout 包是老版本的，所以對於新版 mahout 包而言，改動非常大。

新版與舊版最大的區別：

1. 聚類演算法的驅動類 driver 不支援讀取 vector 集合資料 list；只提供讀取檔案的形式。

2. 引用的hadoop 包不一樣。

1. 資料構造類

public class ******dataset , , ,

, , , , , , ,

, };

//******dataset 的 writepointstofile 方法，將測試點集寫入檔案裡

// 首先我們將測試點集包裝成 vectorwritable 形式，從而將它們寫入檔案

public static listgetpoints(double raw)

}2. kmeans 演算法呼叫

public class kmeanstest

}3. canopy演算法呼叫

public class canopytest

}4. fuzzykmeans演算法呼叫

public class fuzzykmeanstest

}關於狄利克雷演算法，新版mahout已經摒棄該演算法了；已經沒有相關驅動類。

Mapreduce 推薦引擎

購買過該商品的顧客還購買過哪些商品給乙個商品，推薦購買過這個商品的使用者經常購買的五件產品輸出是鍵值對，鍵是商品，值是5個商品的列表 map1 key userid value userid購買過的產品 map userid,item reduce1 reduce userid,item i1,...

關於《深入推薦引擎相關演算法聚類》文章學習感悟

Mapreduce 推薦引擎

推薦引擎分類介紹

推薦引擎分為哪幾類，個性化推薦引擎的介紹

關於《深入推薦引擎相關演算法 聚類》文章學習感悟

Mapreduce 推薦引擎

推薦引擎分類介紹

推薦引擎分為哪幾類，個性化推薦引擎的介紹

相關推薦

關於《深入推薦引擎相關演算法聚類》文章學習感悟