Hive的UDF实现详解

程序员文章站 2022-05-29 19:54:54

...

Hive自身查询语言HQL能完成大部分的功能，但遇到特殊需求时，需要自己写UDF实现。以下是一个完整的案例。 1、eclipse中编写UDF ①项目中加入hive的lib下的所有jar包和Hadoop中share下hadoop-common-2.5.1.jar（Hadoop目前最新版本2.5.1）。 ②UDF类要继承org

Hive自身查询语言HQL能完成大部分的功能，但遇到特殊需求时，需要自己写UDF实现。以下是一个完整的案例。

1、eclipse中编写UDF

①项目中加入hive的lib下的所有jar包和Hadoop中share下hadoop-common-2.5.1.jar（Hadoop目前最新版本2.5.1）。
②UDF类要继承org.apache.hadoop.hive.ql.exec.UDF类，类中要实现evaluate。当我们在hive中使用自定义的UDF的时候，hive会调用类中的evaluate方法来实现特定的功能
③导出项目为jar文件。
注：项目的jdk与集群的jdk要一致。
具体例子：

package com.zx.hive.udf;

import org.apache.hadoop.hive.ql.exec.UDF;

public class UdfTestLength extends UDF{

    public Integer evaluate(String s)
    {
        if(s==null)
        {
            return null;
        }else{
            return s.length();
        }
    }
}

将上面的类打成jar的形式，我使用eclipse直接导出为test-udf.jar包，然后放在/root目录中。

2、自定义函数调用过程：

①添加jar包（在hive命令行里面执行）
hive> add jar /root/test-udf.jar;

②创建临时函数，hive命令行关闭后，即失效。
hive> create temporary function testlength as ‘com.zx.hive.udf.UdfTestLength';

③调用
hive> select id, name, testlength(name) from student;

④将查询结果保存到HDFS中

hive> create table result row format delimited fields terminated by '\t' as select id, testlength(nation) from student;

相关标签： Hive UDF 实现详解 Hive 自身查询语言 H

上一篇： Oracle进制转换函数

下一篇： ACCESS的数据库安全问题答疑

Hive的UDF实现详解

React如何实现登录？react登录模块的详解

JDBC实现Mysql自动重连机制的方法详解

Base64加解密的实现方式实例详解

c# 实现IComparable、IComparer接口、Comparer类的详解

解决C# winForm自定义鼠标样式的两种实现方法详解

Python实现屏幕截图的代码及函数详解

详解iOS 计步器的几种实现方式

php+mysql实现的二级联动菜单效果详解

Java实现的数组去重与排序操作详解

JAVA多线程实现生产者消费者的实例详解