欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页  >  数据库

2.3 Configurable接口

程序员文章站 2022-05-26 15:36:23
...

2.3 Configurable接口 Configurable是一个很简单的接口,也位于org.apache.hadoop.conf包中,其类图如图2-3所示。 从字面理解,Configurable的含义是可配置的,如果一个类实现了Configurable接口,意味着这个类是可配置的。也就是说,可以通过为这个类的对象

2.3 Configurable接口

Configurable是一个很简单的接口,也位于org.apache.hadoop.conf包中,其类图如图2-3所示。

2.3 Configurable接口

从字面理解,Configurable的含义是可配置的,如果一个类实现了Configurable接口,意味着这个类是可配置的。也就是说,可以通过为这个类的对象传入一个Configuration实例,提供对象工作需要的一些配置信息。Hadoop的代码中有大量的类实现了Configurable接口,如org.apache.hadoop.mapred.SequenceFileInputFilter.RegexFilter。RegexFilter对象工作时,需要提供一个正则表达式,用于过滤读取的记录。由于RegexFilter的父类Filter中实现的Configurable接口,RegexFilter可以在它的setConf()方法中,使用Configuration.get()方法获取以字符串传入的正则表达式,并初始化成员变量p。相关代码如下:

  1. public void setConf(Configuration conf) {
  2. //在conf中获取键为"sequencefile.filter.regex"(FILTER_REGEX)的配置项
  3. String regex = conf.get(FILTER_REGEX);
  4. if (regex==null)
  5. throw new RuntimeException(FILTER_REGEX + "not set");
  6. this.p = Pattern.compile(regex);
  7. this.conf = conf;
  8. }

Configurable.setConf()方法何时被调用呢?一般来说,对象创建以后,就应该使用setConf()方法,为对象提供进一步的初始化工作。为了简化对象创建和调用setConf()方法这两个连续的步骤,org.apache.hadoop.util.ReflectionUtils中提供了静态方法newInstance(),代码如下:

  1. public static T> T newInstance(ClassT>theClass, Configuration conf)

方法newInstance()利用Java反射机制,根据对象类型信息(参数theClass),创建一个新的相应类型的对象,然后调用ReflectionUtils中的另一个静态方法setConf()配置对象,代码如下:

  1. public static void setConf(Object theObject, Configuration conf) {
  2. if(conf != null) {
  3. //传入的对象实现了Configurable接口
  4. if(theObject instanceof Configurable) {
  5. //调用对象的setConf方法,传入Configuration对象
  6. ((Configurable) theObject).setConf(conf);
  7. }
  8. setJobConf(theObject, conf);
  9. }
  10. }

在setConf()中,如果对象实现了Configurable接口,那么对象的setConf()方法会被调用,并根据Configuration类的实例conf进一步初始化对象。