Hive 自定義函式

2021-10-01 19:27:46 字數 607 閱讀 3963

-- 返回 所有自帶的函式

show functions

-- 返回對該函式的解釋

desc

function spilt

-- 返回對該函式的使用例子

desc

function

extended split

1. udf:user-defined function 

datediff, date_format 等函式 一進一出

2. udaf:user-defined aggregation function

聚合函式 count, max, min 一進多出

3. udtf: user-defined table-generting function

lateral view explore() 一進多出

以上的一, 多,指的不是韓式傳進來多少引數,而是指的對多少行資料, 行,處理的結果出來多少行。

比如 split函式, 切分的是一行資料,結果是乙個陣列, 乙個陣列是一行資料,所以算是一進一出,是udf。

在spark中會使用。

hive自定義函式

1.建立類,繼承udf package com.hivedemo.udf import org.apache.hadoop.hive.ql.exec.description import org.apache.hadoop.hive.ql.exec.udf 自定義hive函式 description...

Hive 自定義函式

hive 支援自定義udf,udtf,udaf函式 以自定義udf為例 使用乙個名為evaluate的方法 package com.hive.custom import org.apache.hadoop.hive.ql.exec.udf import org.apache.hadoop.io.in...

HIVE自定義函式型別

package udf.udfs class import org.apache.commons.lang.stringutils import org.apache.hadoop.hive.ql.exec.udf import org.apache.hadoop.io.text public cl...