hive自定義函式UDF

2021-07-27 23:30:09 字數 897 閱讀 8305

hive自定義函式(udf),可以幫助使用者輕鬆實現在hql語句中展現自定義查詢結果。

這裡以乙個簡單的連線函式來實現使用者自定義函式,假設表結構如下:

表中只有兩個簡單的字段,id和name。這裡實現乙個將id和name用"-"連線的函式,最後輸出結果。

第一步、書寫stringjoin類,繼承udf,實現名稱為evaluate的方法;

書寫完成之後打包stringjoin.jar,準備上傳。

第二步、hive命令列下執行add jar /path/to/stringjoin.jar;

建立臨時函式.

create temporary function strjoin as "com.lenovo.hive.udf.stringjoin";
這樣在hql語句中就可以使用strjoin函式了。這裡create temporary function時並沒有指定函式名,預設採用evaluate,所以

這個名字是固定的,不能隨便改動。在udf類中也並沒有找到evaluate這個方法,我猜測這個名字是hive固定寫法。

第三步、利用strjoin函式查詢結果。

結果和預期是一致的,udf函式生效了。

hive自定義函式 UDF

幾個命令 檢視所有函式 hive show functions 檢視函式的使用方法 hive desc function 函式名 兩數和 addudf 自定義hive函式 description name myadd value myadd int a int b return a b extend...

hive自定義udf函式

在建立自定義函式時,需要將jar包全部部署到hive server節點的所有機器的使用者定義的udf引數目錄 hive.reloadable.aux.jars.path.jars.path.property property value usr lib hive lib value 呼叫 impor...

Hive自定義UDF函式

匯入自定義udf.jar的第3種方式!匯入核心依賴 外部pom已經匯入了hadoop依賴!org.apache.hivegroupid hive execartifactid 1.2.1version dependency dependencies package com.zhengkw.userf...