機器學習開源專案mahout 用其開發推薦引擎

2021-06-20 20:59:22 字數 926 閱讀 5869

機器學習開源專案mahout+用其開發推薦引擎

開放源**專案mahout,實現了很多機器學習的演算法和一些實用的系統,對於從事機器學習和web挖掘的人員來說是個很值得學習的資源。mahout是 基於hadoop的,可以分布式執行,至此lucence、nutch、mahout為構建開源的分布式的搜尋引擎和web挖掘提供了完整的支援,三劍合 璧,威力無窮。mahout的**風格延續了nutch的優良風格,**可讀性很強,包含了推薦系統、聚類中的kmeans,fuzzykmeans,

canopy, dirichlet,分類中的bayes、cbayes等演算法的實現,以及交叉驗證,計算正確率,各種距離,模型的構建等。還缺少像神經網路這個強大工具 的實現,但未來很可能會加上。

mahout的詳細簡介在這裡。

基於 apache mahout 構建社會化推薦引擎

web 2.0 的乙個核心思想就是「群體智慧型」,即基於大眾行為,為每個使用者提供個性化的推薦。這使得如何讓使用者能更快速更準確的獲得所需要的資訊,成為了 web 應用成敗的關鍵。apache mahout 是 asf(apache software foundation)的乙個較新的開源專案,提供機器學習領域的一些經典演算法的高效實現。本文主要講述如何基於 apache mahout 來構建社會化推薦引擎,幫助 web 應用開發者更高效的實現個性化推薦功能,從而提高終端使用者滿意度。

推薦引擎利用特殊的資訊過濾(if,information filtering)技術,將不同的內容(例如電影、**、書籍、新聞、、網頁等)推薦給可能感興趣的使用者。通常情況下,推薦引擎的實現是通過將使用者 的個人喜好與特定的參考特徵進行比較,並試圖**使用者對一些未評分專案的喜好程度。參考特徵的選取可能是從專案本身的資訊中提取的,或是基於使用者所在的社 會或社團環境。

Mahout 0 3 機器學習開源專案

有關機器學習的開源專案apache mahout三月份的時候推 出了它的0.3版本,這個新版本在之前的基礎上新增了一些新功能,比之前的版本更為穩定,效能也有相應的提公升。infoq採訪了apache mahout專案的開發者grant ingersoll和ted dunning,其中grant in...

Mahout 機器學習

wget tar xzvf mahout distribution 0.8.tar.gz cd mahout distribution 0.8 sudo vi etc profile 增加 export path path home ysc mahout distribution 0.8 bin s...

十大機器學習開源專案

graphlab是一種新的面向機器學習的並行框架。graphlab提供了乙個完整的平台,讓機構可以使用可擴充套件的機器學習系統建立大資料以分析產品,該公司客戶包括zillow adobe zynga pandora bosch exxonmobil等,它們從別的應用程式或者服務中抓取資料,通過推薦系...