MapReduce計數例項

2021-09-22 19:43:40 字數 1056 閱讀 2719

mapreduce 是hadoop的分布式計算系統,是乙個分布式運算程式的程式設計框架。

為什麼需要mapreduce

本例項是基於hadoop2.8.5的偽分布式平台。如果jps命令執行後如下圖所示,則偽分布式搭建完成。hadoop偽分布式和完全分布式的搭建後續會進行更新?。

先將本地乙個檔案上傳到hdfs

hadoop fs -put readme.txt /

上述/表示將readme.txt 上傳至hdfs根目錄下,也可先建立目錄再指定目錄上傳。

檢視是否上傳成功

hadoop fs -ls

進入mapreduce目錄

cd /usr/local/hadoop/share/hadoop/mapreduce

執行countword程式

hadoop jar hadoop-mapreduce-examples-2.8.5.jar wordcount /readme.txt /count.txt

上述表示執行wordcount程式,輸入為readme.txt ,輸出為count.txt,都放在根目錄下。

hadoop fs -ls /count.txt檢視countword執行後輸出在count.txt目錄下那個檔案中

hadoop fs -cat /count.txt/part -r -00000顯示結果

如上圖所示,結果為readme.txt中各單詞的個數。

參考部落格,感謝大佬!!!

mapreduce應用例項

1 mapreduce是乙個程式設計模型,既不是平台也不是特定的語言。面向記錄的資料處理 鍵和值 便於跨多個節點分配任務 2 集群上的資源管理取決於版本 1 mapreduce v1 mrv1,經典mapreduce 使用jobtracker和tasktracker 架構 守護程序啟動和管理map任...

499 單詞計數 Map Reduce版本

原題 您在真實的面試中是否遇到過這個題?是 chunk2 lintcode code bye get mapreduce result bye 2 goodbye 1 google 1 hadoop 1 code 2 lintcode 1 標籤 big data map reduce 思路 沒怎麼看...

原創 MapReduce計數器

mapreduce框架內建了一些計數器的支援,當然,我們也可以設定自己的計數器用來滿足一些特殊的要求。其實計數器可以用來完成很多事,關鍵要看你如何用,例如你想知道map輸入資料的指定記錄特定的資訊有多少可以設定計數,還有,在mr執行過程中,一些特定事件的發生次數也可以記錄。使用計數器的莫大好處在於整...