Kylin 入門案例

2021-10-12 07:06:20 字數 2875 閱讀 1251

列名

列型別說明

idstring

訂單id

date1

string

訂單日期

channelid

string

訂單渠道(商場、京東、天貓)

productid

string

產品id

regionid

string

區域名稱

amount

int商品下單數量

price

double

商品金額 列名

列型別說明

channelid

string

渠道id

channelname

string

渠道名稱

列名 列型別 說明

productid string 產品id

productname string 產品名稱 列名

類型別說明

regionid

string

區域id

regionname

string

區域名稱

操作步驟

1、使用 beeline 連線hive

!connect jdbc:hive2:

//node1:

10000

create database hanjiaxiaozhi_kylin_dw;

use hanjiaxiaozhi_kylin_dw;

-- 檢視表是否建立成功

show tables;

mkdir ~

/dat_file

匯入資料到表中

select * from dw_sales;
操作步驟:

use hanjiaxiaozhi_dw
select date1,

sum(price) as total_money,

sum(amount) as total_amount from dw_sales group by date1;

3、建立模型(model

4、建立立方體(cube

5、執行構建、等待構建完成

6、再執行sql查詢,獲取結果

操作步驟

指定維度字段

select

t1.date1,

t2.regionid,

t2.regionname,

t3.productid,

t3.productname,

sum(t1.price)

as total_money,

sum(t1.amount)

as total_amount

from

dw_sales t1

inner

join dim_region t2

on t1.regionid = t2.regionid

inner

join dim_product t3

on t1.productid = t3.productid

group

by t1.date1,

t2.regionid,

t2.regionname,

t3.productid,

t3.productname

order

by t1.date1,

t2.regionname,

t3.productname

kylin入門到實戰 入門

kylin是一款開源的分布式資料分析工具,基於hadoop之上的sql查詢介面,能支援超大規模的資料分析。響應時間在亞秒級別,其核心是預計算,計算結果存放在hbase中。3.1fact table 事實表 事實表是指包含了大量不冗餘資料的表,其列一般有兩種,分別為包含事實資料的列,包含維表forei...

kylin入門到實戰 入門

排版亂?請移步原文獲得更好的閱讀體驗 1.概述 kylin是一款開源的分布式資料分析工具,基於hadoop之上的sql查詢介面,能支援超大規模的資料分析。響應時間在亞秒級別,其核心是預計算,計算結果存放在hbase中。2.特性 3.相關概念 3.1fact table 事實表 事實表是指包含了大量不...

Hibernate入門 入門案例

4.1 資料庫建立表 create table cst customer cust id bigint 32 not null auto increment comment 客戶編號 主鍵 cust name varchar 32 not null comment 客戶名稱 公司名稱 cust so...