Spark例項建立及引數解釋

2021-10-14 02:00:21 字數 1026 閱讀 8592

def

get_sparksession

: conf =

(sparkconf(

).setmaster(

"yarn").

set(

"spark.executor.memory"

,"2g").

set(

'hive.exec.dynamic.partition'

,'true').

set(

'spark.sql.autobroadcastjointhreshold'

,'-1').

set(

'hive.exec.dynamic.partition.mode'

,'nostrick').

set(

'hive.exec.max.dynamic.partitions'

,'100000').

set(

'hive.exec.max.dynamic.partitions.pernode'

,'100000').

set(

"spark.port.maxretries"

,"100"))

spark = sparksession.builder.config(conf=conf)

.enablehivesupport(

).getorcreate(

)# sparksession 是 spark sql 的入口,使用 dataset 或者 datafram 編寫 spark sql 應用的時候,第乙個要建立的物件就是 sparksession。

# builder 是 sparksession 的構造器。 通過 builder, 可以新增各種配置。

引數參考:

Spark常用引數解釋及建議值

spark常用引數解釋及建議值 spark的預設配置檔案位於堡壘機上的這個位置 spark conf dir spark defaults.conf,使用者可以自行檢視和理解。需要注意的是,預設值優先順序最低,使用者如果提交任務時或者 裡明確指定配置,則以使用者配置為先。使用者再理解引數含義的基礎上...

cp命令「 d」引數解釋及例項

d 若原始檔為連線檔案杜屬性,則複製連線檔案屬性而非檔案本身。例如 1 root ubuntu tmp cp s bashrc bashrc slink 建立乙個快捷方式 root ubuntu tmp cp l bashrc bashrc hlink 建立乙個硬連線 root ubuntu tmp...

vimrc 配置及引數解釋

使用vim 編輯乙個檔案時,檔案內容的展現方式和 vimrc 的設定有關。在 etc vim vimrc 中有系統關於vim的一些的配置。對於系統中的每個使用者user,在 home user vimrc 中含有自己的vim 配置資訊 如果沒有這個配置檔案可以自己建立,它是乙個隱藏檔案,可以提供 l...