RDD partitioner入門詳解

2021-10-11 11:14:37 字數 1313 閱讀 9923

partitioner是rdd的乙個屬性,預設值為none.可以被子類重寫

@transient

val partitioner: option[partitioner]

= none

決定rdd如何分割槽,就是具體的分割槽方式,測試一下

預設的partitioner是none

val conf =

new sparkconf(

)"wordcount"

).setmaster(

"local"

)val sc =

new sparkcontext(conf)

val lines: rdd[

string

]= sc.textfile(

"d:\\tmp",2

) println(lines.partitioner)

//none

}預設的partitioner是none

val conf =

new sparkconf(

)"wordcount"

).setmaster(

"local"

)val sc =

new sparkcontext(conf)

private

val rdd: rdd[

int]

= sc.parallelize(array(1,

2,3)

) println(rdd.partitioner)

//none

}如果是kv形式的rdd,可以重新分割槽,如下

val conf =

new sparkconf(

)"wordcount"

).setmaster(

"local"

)val sc =

new sparkcontext(conf)

private

val rdd: rdd[

int]

= sc.parallelize(array(1,

2,3)

)private

val value: rdd[

(int

,int)]

= rdd.map(

(x:int

)=>

(x,1))

.partitionby(

new hashpartitioner(3)

) println(value.partitioner)

//some(org.apache.spark.hashpartitioner@3)

}

Boost Graph Library 快速入門

boost graph library 快速入門 by 燕飛龍 南亮亮 採用boost中的鄰接鍊錶 adjacency list 實現圖的定義 下面是乙個鄰接鍊錶定義的例子 include 首先定義圖中節點和邊的屬性 struct vertexproperty structedgeproperty ...

Spring Cloud Stream使用入門

前面博文嘗試使用了srping cloudbus,裡面引入了spring cloud starter bus kafka和spring cloud starter bus amqp,實時上它們分別依賴了spring cloud starter stream kafka和spring cloud st...

小紅書最新入駐,小紅書入駐細節,小紅書商家入駐

商家首先要到商家入駐系統中進行註冊,並進行登入。登入後,填寫入駐的資訊 公司 財務 店鋪等資訊 提交相應的資質。提交的資質通過後,系統會返回審核的結果給你。最後,完成系統的培訓就正式加入小紅書,並成功開店了。下面是填寫的一些細節和指南 公司的資訊 公司的資訊應該包含管理者的 經營位址 記住後期寄發票...