spark鍵值對轉換操作例子

2021-09-20 03:42:32 字數 386 閱讀 7084

題目:給定一組鍵值對(「spark」,2),(「hadoop」,6),(「hadoop」,4),(「spark」,6),鍵值對的key表示圖書名稱,value表示某天圖書銷量,請計算每個鍵對應的平均值,也就是計算每種圖書的每天平均銷量。

很顯然,對於上面的題目,結果是很顯然的,(「spark」,4),(「hadoop」,5)。

package cn.com.day1

import org.apache.spark.sparkconf

import org.apache.spark.sparkcontext

object test_05

}

執行結果:

(spark,4)

(hadoop,5)

將普通的鍵值對轉換成xml形式的鍵值對

size medium 今天在做foa網域名稱轉出的時候,有乙個註冊 和註冊公司的對應關係。就是說通過poll埠你可以查到註冊 然後通過這個對應關係找到對應公司。於是想把普通文字中的鍵值對,轉換成xml檔案。a.txt檔案中的內容 原始檔中沒有 為了好判斷,將空格轉換成 size 1 reserve...

spark鍵值對操作 一

鍵值對rdd也叫做pair rdd 把乙個普通 rdd轉換為pair rdd的時候使用map 函式來實現 使用第乙個單詞作為乙個鍵,建立乙個pair rdd pairs lines.map lambda x x.split 0 x reducebykey func 合併具有相同鍵的值 rdd.red...

Spark學習筆記 鍵值對操作

鍵值對 rdd是 spark 中許多操作所需要的常見資料型別 鍵值對 rdd 通常用來進行聚合計算。我們一般要先通過一些初始etl 抽取 轉化 裝載 操作來將資料轉化為鍵值對形式。spark 為包含鍵值對型別的 rdd 提供了一些專有的操作。1.建立pair rdd val input sc.par...