hive 自定義元資料表 Hive 元資料表含義

2021-10-13 15:12:55 字數 4183 閱讀 4326

hive——元資料表含義

1、version   -- 查詢版本資訊

fieldtypecomment

ver_id

bigint(20)

id主鍵

schema_version

varchar(127)

hive版本

version_comment

varchar(255)

版本說明

2、dbs     -- 儲存hive中所有資料庫的基本資訊

fieldtypecomment

db_id

bigint(20)

資料庫id

desc

varchar(4000)

資料庫描述

db_location_uri

varchar(4000)

資料庫hdfs路徑

name

varchar(128)

資料庫名

owner_name

varchar(128)

資料庫所有者使用者名稱

owner_type

varchar(10)

所有者角色

3、database_params  --該錶儲存資料庫的相關引數,在create database時候用

fieldtypecomment

db_id

bigint(20)

資料庫id

param_key

varchar(180)

引數名param_value

varchar(4000)

引數值4、tbls  --該表中儲存hive表、檢視、索引表的基本資訊

fieldtypecomment

tbl_id

bigint(20)

表idcreate_time

int(11)

建立時間

db_id

bigint(20)

資料庫id

last_access_time

int(11)

上次訪問時間

owner

varchar(767)

所有者retention

int(11)

保留字段

sd_id

bigint(20)

序列化配置資訊

tbl_name

varchar(128)

表名tbl_type

varchar(128)

表型別view_expanded_text

mediumtext

檢視的詳細hql語句

view_original_text

mediumtext

檢視的原始hql語句

5、table_params  --該錶儲存表/檢視的屬性資訊。

fieldtypecomment

tbl_id

bigint(20)

表idparam_key

varchar(256)

屬性名param_value

varchar(4000)

屬性值6、sds  --該錶儲存檔案儲存的基本資訊,如input_format、output_format、是否壓縮等。

fieldtypecomment

sd_id

bigint(20)

儲存資訊id

cd_id

bigint(20)

字段資訊id

input_format

varchar(4000)

檔案輸入格式

is_compressed

bit(1)

是否壓縮

is_storedassubdirectories

bit(1)

是否以子目錄儲存

location

varchar(4000)

hdfs路徑

num_buckets

int(11)

分桶數量

output_format

varchar(4000)

檔案輸出格式

serde_id

bigint(20)

序列化類id

7、serds      --該錶儲存序列化使用的類資訊

fieldtypecomment

serde_id

bigint(20)

序列化類配置id

name

varchar(128)

序列化類別名

slib

varchar(4000)

序列化類

8、serde_params      --該錶儲存序列化的一些屬性、格式資訊,比如:行、列分隔符

fieldtypecomment

serde_id

bigint(20)

序列化類配置id

param_key

varchar(256)

屬性名param_value

varchar(4000)

屬性值9、columns_v2      --該錶儲存表對應的字段資訊。

fieldtypecomment

cd_id

bigint(20)

字段資訊id

comment

varchar(256)

字段注釋

column_name

varchar(128)

欄位名type_name

varchar(4000)

字段型別

integer_idx

int(11)

字段順序

10、partitions      --該錶儲存表分割槽的基本資訊。

fieldtypecomment

part_id

bigint(20)

分割槽id

create_time

int(11)

分割槽建立時間

last_access_time

int(11)

最後一次訪問時間

part_name

varchar(767)

分割槽名sd_id

bigint(20)

分割槽儲存id

tbl_id

bigint(20)

表id11、partition_keys      --該錶儲存分割槽的字段資訊。

fieldtypecomment

tbl_id

bigint(20)

表idpkey_comment

varchar(4000)

分割槽字段說明

pkey_name

varchar(128)

分割槽欄位名

pkey_type

varchar(767)

分割槽字段型別

integer_idx

int(11)

分割槽字段順序

12、partition_key_vals      --該錶儲存分割槽字段值。

fieldtypecomment

part_id

bigint(20)

分割槽id

part_key_val

varchar(255)

分割槽字段值

integer_idx

int(11)

分割槽字段值順序

13、partition_params      --該錶儲存分割槽的屬性資訊。

fieldtypecomment

part_id

bigint(20)

分割槽id

param_key

varchar(256)

分割槽屬性名

param_value

varchar(4000)

分割槽屬性值

其他不常用的元資料表:

db_privs:資料庫許可權資訊表。通過grant語句對資料庫授權後,將會在這裡儲存。

tab_col_stats:表字段的統計資訊。使用analyze語句對表字段分析後記錄在這裡。

tbl_col_privs:表字段的授權資訊

part_privs:分割槽的授權資訊

part_col_stats:分割槽欄位的統計資訊。

part_col_privs:分割槽欄位的許可權資訊。

funcs:使用者註冊的函式資訊

func_ru:使用者註冊函式的資源資訊

hive自定義函式

1.建立類,繼承udf package com.hivedemo.udf import org.apache.hadoop.hive.ql.exec.description import org.apache.hadoop.hive.ql.exec.udf 自定義hive函式 description...

Hive 自定義函式

返回 所有自帶的函式 show functions 返回對該函式的解釋 desc function spilt 返回對該函式的使用例子 desc function extended split1.udf user defined function datediff,date format 等函式 一...

Hive 自定義函式

hive 支援自定義udf,udtf,udaf函式 以自定義udf為例 使用乙個名為evaluate的方法 package com.hive.custom import org.apache.hadoop.hive.ql.exec.udf import org.apache.hadoop.io.in...