關於spark2 x後的SparkSession

apache spark2.0 引入了sparksession，其為使用者提供了乙個統一的切入點來使用spark的各項功能，並且允許使用者通過它呼叫dataframe和dataset相關api來編寫spark程式。最重要的是，它減少了使用者需要了解的一些概念，使得我們可以很容易地與spark互動,在sparksession中封裝了sparkcontext,sparkconf等,為了解決使用者可能對sparkcontext的混亂(不知道當時使用的哪乙個context),使用的時候就和sparkcontext差不多;

val spark=sparksession.builder().master("local").getorcreate().config("key","value") //工廠創造

spark.read.textfile(path:string),除了textfile,還有load,csv,json,text,format,jdbc等讀取方法;封裝了;很是方便的;

sparksession中部分原始碼如下:

@inte***cestability.stable
class builder extends logging

val sparkcontext = usersuppliedcontext.getorelse 
} val sc = sparkcontext.getorcreate(sparkconf)
// maybe this is an existing sparkcontext, update its sparkconf which maybe used
// by sparksession

關於spark2 x後的SparkSession

Spark2 X的記憶體管理模型

CDH5 11安裝spark2 x詳細步驟

關於Spark和Spark的學習資料

關於spark2 x後的SparkSession

Spark2 X的記憶體管理模型

CDH5 11安裝spark2 x詳細步驟

關於Spark和Spark的學習資料

相關推薦