如何使用zeppelin進行資料分析

2021-10-16 17:19:52 字數 891 閱讀 5964

spark官方文件:

yum -y installl lrzsz
1.在hadoop目錄下執行,從本地(windows)上傳user.csv檔案到虛擬機器2.檢視hdfs目錄

hdfs dfs -ls /
3.遞迴建立目錄

hdfs dfs -mkdir -p /events/users
4.上傳檔案到hdfs

hdfs dfs -put user.csv /events/users
5.在zeepelin中操作(1)錄入資料

(2)檢視表結構

如何使用Python與Mysql進行資料互動

自己的夢想需要你自己去實現 python 在mysql的官網獲取python與mysql的互動手冊mysql官方手冊 pythontodatabase.py import mysql.connector cnx mysql.connector.connect user root password 6...

Zeppelin使用說明

在zeppelin中以筆記本 notebook 的形式組織和管理互動式資料探索任務,乙個筆記本 note 可以包括多個段 paragraph 段是進行資料分析的最小單位,即在段中可以完成資料分析 的編寫以及結果的視覺化檢視。下圖所示筆記本為 應用嚮導 圖中紅框部分為段。在段內,包括段標題 段 編輯區...

如何進行資料同步

建立資料庫的鏈結 create database link dblink test connect to 需要鏈結的資料庫的名字 identified by 密碼 using 這個鏈結的別名 建立物化檢視用於同步資料 create materialized view test test是同步過來的實...