hive學習筆記

2021-07-13 12:33:56 字數 1429 閱讀 8038

hql語句的執行過程

解析器 語法分析

編譯器 生成hql語句執行計畫

優化器 生成最優執行計畫

show tables

show functions

desc 表名 檢視表的資訊

dfs -lsr /tmp 在cli中也可以檢視hdfs上的檔案

!ls /root 在cli中也可以執行linux的命令

source /root/demo.sql 執行乙個sql檔案

hive -s 就能進入cli 有個靜默模式 

hive -e 'desc test1'; 不進入hive cli模式 直接執行一條語句

hive --service hwi //hive 自帶的圖形介面管理工具  

基本資料型別

tinyint/smallint/int/bigint

float/double

boolean

string

timestamp/date

char(20) vachar(20)區別 char固定20個字元長度 vachar而不是

array // create table student(

sid int,sname string,grade array

);map// create table student(

sid int,sname strint,grade map

);struct 結構型別

create table sudent(

id int,

sname string,

info struct )

資料庫 檔案 表 檢視

create table sudent(

id int,

sname string,

)location '/tmp/student',row format

create table t4 as select * from student;//子查詢建立表

explain select * from sample_table //生成乙個執行計畫

外部表 只是制定了乙個hive 在hdfs資料儲存目錄的鏈結 刪除表的時候只是刪除了鏈結

桶表桶表是對資料進行雜湊取值,然後放到不同檔案中儲存

create table bucket_table(

sid int,

sname string

)clustered by (sname) into 5 buckets;

檢視 邏輯概念 虛擬的

create vie empinfo 

asselect e.empno,e.ename,e.sal*12 analsel ,d.name

from emp e,dept d

where e.deptno=d.deptno

hive 高階

Hive學習筆記 Hive 引數

第一部分 hive 引數 hive.exec.max.created.files 說明 所有hive執行的map與reduce任務可以產生的檔案的和 預設值 100000 hive.exec.dynamic.partition 說明 是否為自動分割槽 預設值 false hive.mapred.re...

Hive學習筆記 Hive概述

1.1 資料倉儲 可以利用資料倉儲來儲存我們的資料,但是資料倉儲有別於我們常見的一般資料庫。資料倉儲是乙個面向主題的 整合的 不可更新的 隨時間不變化的資料整合,它用於支援企業或組織的決策分析處理。物件導向的 倉庫中的資料是按照一定的主題進行組織的。主題即使用者使用資料倉儲進行決策時所關心的重點方面...

hive學習筆記

在使用hive進行開發時,我們往往需要獲得乙個已存在hive表的建表語句 ddl 然而hive本身並沒有提供這樣乙個工具。要想還原建表ddl就必須從元資料入手,我們知道,hive的元資料並不存放在hdfs上,而是存放在傳統的rdbms中,典型的如mysql,derby等,這裡我們以mysql為元資料...