MapReduce學習筆記 2

同樣，hadoop預定義了一些非常有用的reducer類

預設的做法是對key進行雜湊來確定reducer，hadoop通過hashpartitioner類強制執行這個策略。但是有時我們想通過key值中的某個屬性進行排序，而不是key的整體，使用hashpartitioner就會出錯。所以我們需要自己定製partitionger。如前面提到的edge類，我們希望通過departure屬性排序，而不是key（(departurenode,arrivalnode)）進行排序。

public
class edgepartitioner implements partitioner
@override
public
void
configure(jobconf conf) 
}

這張圖也許能更好的幫助理解partitioner：

每個圖是乙個key/value對，形狀代表key。內部圖案代表value。shuffling過後，相同key的圖示放入相同的reducer，不同的鍵也可以放入同乙個reducer。partitioner決定放入的位置。

4、combiner：本地reducer

combiner是在map結束後輸出之前進行本地reducer，這樣可以減少傳輸量，提高效能。

public
class
wordcount2 
catch
(exception e) }}

注意：以上**使用hadoop舊的api寫成，有許多在新api中不建議使用的類和介面。

MapReduce學習筆記 2

MapReduce學習筆記

Mapreduce學習筆記（二）

MapReduce學習筆記之Reduce任務（四）

MapReduce學習筆記 2

MapReduce學習筆記

Mapreduce學習筆記（二）

MapReduce學習筆記之Reduce任務（四）

相關推薦