147 Mahout執行在Hadoop集群

2021-09-26 03:45:03 字數 383 閱讀 9270

hadoop 執行指令碼

hadoop jar mahout-examples-0.9-job.jar org.apache.mahout.cf.taste.hadoop.item.recommenderjob --input /sanbox/movie/10m.txt --output /sanbox/movie/r -s similarity_loglikelihood
引數說明:

執行結果

上面命令執行完成之後,會在當前使用者的hdfs主目錄生成temp目錄,該目錄可由 --tempdir (path) 引數設定

mahout 分類演算法

資料探勘有很多的領域,分類是其中之一,分類就是把一些新的資料項對映到給定類別的中的某乙個類別,比如當我們發表一篇文章的時候,就可以自動的把這篇文章劃分到某乙個文章類別,一般的過程是根據樣本的資料利用一定的分類演算法,得到分類規則,新的資料過來就依據該規則進行類別的劃分。分類在資料探勘中是一項非常重要...

Mahout 機器學習

wget tar xzvf mahout distribution 0.8.tar.gz cd mahout distribution 0.8 sudo vi etc profile 增加 export path path home ysc mahout distribution 0.8 bin s...

Mahout實戰教程

課程大綱 第一周mahout概述 mahout安裝 mahout安裝測試 mahout演算法庫介紹 解析聚類演算法 解析分類演算法 協同過濾演算法 第二週聚類演算法詳解 一 canopy演算法簡介 1 mahout中canopy演算法實現原理 2 mahout的canopy演算法實戰 3 hadoo...