Hive自定義UDF函式

2021-10-03 18:11:55 字數 1728 閱讀 8557

匯入自定義udf.jar的第3種方式!

匯入核心依賴(外部pom已經匯入了hadoop依賴!!)

>

>

>

org.apache.hivegroupid

>

>

hive-execartifactid

>

>

1.2.1version

>

dependency

>

dependencies

>

package com.zhengkw.userfunction;

import org.apache.hadoop.hive.ql.exec.udf;

/** * @classname:userudf

* @author: zhengkw

* @description: 自定義 udf

* @date: 20/03/11上午 12:26

* @version:1.0

* @since: jdk 1.8

*/public

class

userudf

extends

udf//返回乙個小寫字串

return s.

tolowercase();}}

打包,上傳到$hive_home/auxlib切換到$hive_home

mkdir auxlib
重啟hive!!!重啟hive!!!重啟hive!!!

hive在啟動時會載入lib裡的jar,也會載入lib同級的auxlib(此為使用者自定義jar的存放位置,官方要求名字必須是auxlib),這樣就能載入成功。

上傳到任意位置,一般建立乙個目錄起名為jar,方便自定義jar的管理!

用此方法可以不用重啟hive!就是將jar直接用hive中的add jar命令新增入classpath,不需要重啟,自動重新整理!

create temporary function myfc as 'com.zhengkw.userfunction.userudf'

;

臨時函式與永久函式的區別

提前準備好資料,我用的資料是oracle中的scott表裡的emp表!

將表資料存入hive中!

hive自定義函式UDF

hive自定義函式 udf 可以幫助使用者輕鬆實現在hql語句中展現自定義查詢結果。這裡以乙個簡單的連線函式來實現使用者自定義函式,假設表結構如下 表中只有兩個簡單的字段,id和name。這裡實現乙個將id和name用 連線的函式,最後輸出結果。第一步 書寫stringjoin類,繼承udf,實現名...

hive自定義函式 UDF

幾個命令 檢視所有函式 hive show functions 檢視函式的使用方法 hive desc function 函式名 兩數和 addudf 自定義hive函式 description name myadd value myadd int a int b return a b extend...

hive自定義udf函式

在建立自定義函式時,需要將jar包全部部署到hive server節點的所有機器的使用者定義的udf引數目錄 hive.reloadable.aux.jars.path.jars.path.property property value usr lib hive lib value 呼叫 impor...