Zeppelin使用說明

2021-08-10 06:53:15 字數 2511 閱讀 5542

在zeppelin中以筆記本(notebook)的形式組織和管理互動式資料探索任務,乙個筆記本(note)可以包括多個段(paragraph)。段是進行資料分析的最小單位,即在段中可以完成資料分析**的編寫以及結果的視覺化檢視。

下圖所示筆記本為「應用嚮導」,圖中紅框部分為段。在段內,包括段標題、段**編輯區、結果展示區和操作區。

筆記本內和段內操作按鈕說明如下所示:

1) 單擊標題欄部分的「notebook」,在下拉列表中選擇「新建note」。

2) 在彈出的對話方塊中輸入note名稱。

名稱中可以使用包含絕對路徑,系統會自動建立相關目錄。

3) 單擊「建立」。

空白的notebook如下所示:

游標所在處即為段的**編輯區。 1)

單擊標題欄部分的「notebook」,在下拉列表中選擇乙個已存在的notebook。 2)

將關閉移動到乙個已存在段的上方或下方,待滑鼠從箭頭變為手的樣式時,單擊滑鼠,即可建立乙個新的paragraph。

在上圖中,滑鼠為 「手」的樣式,單擊滑鼠左鍵即可在原有paragraph下方建立出乙個新的paragraph,如下圖所示:

在上圖中,從游標所在位置可以開始段**的編輯。 3)

在段中寫入如下**。

val user_data = sc.textfile("/root/ml-100k/u.user")

user_data.first()

val user_fields = user_data.map(line => line.split("\\|"))

val num_users = user_fields.map(fields => fields(0)).count()

val num_genders = user_fields.map(fields => fields(2)).distinct().count()

val num_occupations = user_fields.map(fields => fields(3)).distinct().count()

val num_zipcodes = user_fields.map(fields => fields(4)).distinct().count()

val count_by_occupation = user_fields.map(fields => (fields(3),1)).reducebykey(_ + _).collect().tolist.sortby(_._2).map(line => line._1+"\t"+line._2).tolist.mkstring("\n")

println("%table occupation\tsize\n" + count_by_occupation)

上述為scala**,功能為統計「/root/ml-100k/u.user」檔案中每種職業的使用者數目。其中u.user檔案樣例如下所示,每行是以「|」分割,字段依次表示序號、年齡、性別、職業、id。

1|24|m|technician|85711

2|53|f|other|94043

3|23|m|writer|32067

4|24|m|technician|43537

5|33|f|other|15213

6|42|m|executive|98101

7|57|m|administrator|91344

8|36|m|administrator|05201

9|29|m|student|01002

10|53|m|lawyer|90703

4) 單擊 執行段中的**。

執行結果如下所示:

5) 以餅圖展示結果。單擊**上方的 ,結果以餅圖展示,如下圖所示。

使用說明 附註工具使用說明

附註工具使用說明 附註工具用途 附註工具主要用於更新利用word附註應用程式生成的帶域 的附註,該工具在word右鍵 更新鏈結 的基礎上進行了優化,故在使用時,不能再利用word右鍵 更新鏈結 而要用本工具的 更新當前鏈結 或 更新所有鏈結 使用說明 一 更換路徑 當利用word附註應用程式生成帶域...

使用說明 農用遮光網使用說明

農用遮光網使用說明 建築防塵網購買方 建築施工企業 在購買建築防塵網時,應該對 作出比較,可以分辨品牌 型號,且購買時應該在一定程度上了解信譽良莠。建築防塵網購買方 市場售賣方 在選購建築防塵網時,可以把 作為基礎,好的 可以用來彌補信譽不足,而差的 則需要按照你的服務收費。農用遮光網使用說明 用途...

Hibernate tools 使用說明

05年的8月份第一次接觸hibernate tools,使用起來感覺還不錯,但也沒有深入研究,後來由於一直在做乙個專案,再後來用了一陣myeclipse,現在換了公司,使用wtp all in one eclipse的乙個版本 生成domain的時候使用了hibernate tools,發現都不知怎...