hive簡單資料分析

2021-08-28 03:04:33 字數 569 閱讀 6205

select brand_id from user_log limit 10; -- 檢視日誌前10資料
好像也沒啥,和sql相同,,limit取前多少條  , as取別名

count()聚合函式

select count(*) from user_log; -- 用聚合函式count()計算出表內有多少條行資料

distinct不重複

select count(distinct user_id) from user_log; -- 在函式內部加上distinct,查出user_id不重複的資料有多少條
where .. and .. 新增限制條件

select count(*) from user_log where action='2' and brand_id=2661;

資料分析 Hive

hive可以自由擴充套件集群的規模,一般情況下不需要重啟服務。hive支援使用者自定義函式,使用者可以根據自己的需求定義函式。hive容錯性好,節點出現問題sql依舊可以執行。shell執行資料庫語句 hive v e v表示展示log 資訊e表示直接執行sqly語句 hive f執行sql指令碼,...

書單 資料分析入門書籍

這本書真的很簡單,能夠讓你對資料分析的一些基本概念有大致的了解。即便是你毫無資料分析經驗,一兩天也足夠讀完整本書了。這本書的實操性並不強,所以也不建議你去跟著實踐,了解作者傳達出來的資料分析基本思想和原則就ok了,這對你建立巨集觀的視野,和接下來的學習很有幫助。另外,書中提到的一些案例,比如提公升化...

搭建運營工單資料分析系統

阿里雲大學課程 搭建運營工單資料分析系統 課程介紹 本課程通過使用阿里雲大資料計算服務maxcompute分析運營工單的歷史資料,並使用大資料開發套件dataide對資料進行分析操作,最後使用quickbi對分析結果進行視覺化展示。課程目標 了解運營工單資料分析系統工作的原理 使用maxcomput...