學習進度5

2022-09-08 10:24:11 字數 1137 閱讀 5312

1、資料匯入:

要求將樣表檔案中的(sales_sample_20170310)資料匯入 hive 資料倉儲中。

2、資料清洗:

要求將 day_id 一列中的數值清洗為真實的日期格式,可用字串表示。

資料 1 對應日期 2021-09-01,依次類推,15 對應日期 2021-09-15

3、資料分析處理:

(1)統計每天各個機場的銷售數量和銷售金額。

要求的輸出字段

day_id,sale_nbr,,cnt,round

日期編號,賣出方**,數量,金額

(2)統計每天各個**商的銷售數量和銷售金額。

要求的輸出字段

day_id,sale_nbr,,cnt,round

日期編號,賣出方**,數量,金額

(3)統計每天各個**商的銷售活躍度。

要求的輸出字段

day_id,sale_nbr, sale_number

日期編號,賣出方**,交易次數(**或者賣出均算交易次數)

(4)匯**計 9 月 1 日到 9 月 15 日之間各個**商的銷售利潤。

編號,賣出方**,**數量,**金額,賣出數量,賣出金額,銷售利潤(賣出

金額-**金額)

(5)設計分析**商的市場地位根據市場交易次數、交易物件個數、銷售機票數量、

銷售利潤等。(選做題)

4、處理結果入庫:

將上述統計分析的結果資料儲存到 mysql 資料庫中。 第 3 頁 共 9 頁

5、資料視覺化展示:

利用 echarts 將上述統計結果以圖形化展示的方式展現出來:餅圖、柱狀圖、地圖、折

線圖等。

我的處理步驟:

先開啟三颱虛擬機器:

然後用xshell連線:

開啟dfs

開啟hive的兩個服務:

學習進度(5)

今天做了做實驗一,複習了一遍linux系統的一些命令。1 切換到目錄 usr bin 2 檢視目錄 usr local 下所有的檔案 3 進入 usr 目錄,建立乙個名為 test 的目錄,並檢視有多少目錄存在 4 在 usr 下新建目錄 test1,再複製這個目錄內容到 tmp 5 將上面的 tm...

暑假周進度總結(5)

本週學習了教材中的第四章 分布式資料庫hbase 通過學習本章內容學習到hbase跟傳統關聯式資料庫有很大的區別,1 資料型別 關聯式資料庫都是運用了關係模型,主體 屬性的方法來找出對應關係來進行儲存,而hbase採用了很簡單的資料模型,他將資料儲存為未解釋的字串。2 資料操作 關聯式資料庫有很多操...

MFC學習進度

目前為止在這個部落格學習 學習了單文件mfc 學習了在視裡建立按鍵,為按鍵建立訊息,新增相應事件。建立乙個新視窗,為視窗新增背景 新增資源。對話方塊型別學習了新增控制項,為控制項新增相應事件,修改視窗控制項的屬性。了解了單文件和對話方塊的包含的檔案的不同,和他們之間的本質區別。基本了解mfc的框架,...