Java 8 聚合操作详解

jopen 10年前

Oracle在2014年3月19日如期发布了Java 8。Java 8版本被认为是具有里程碑意义的一个版本,Oracle在该版本中添加了许多新特性,包括Lambda表达式、方法引用、加强了安全等等。

在众多的新特性中,聚合操作(Aggregate Operations)是针对集合类的一个比较大的变化。通过聚合操作,开发者可以更容易地使用Lambda表达式,并且更方便地实现对集合的查找、遍历、过滤以及常见计算等。

聚合操作与Java 8中的Lambda表达式、方法引用等新特性是相关的,一般一起组合使用,但这里只说明聚合操作的使用,下面就聚合操作的使用进行简单说明。

集合类的层次结构

集合类是Java语言提供的辅助类,是一种较为通用的数据结构,如Map、Set、List等。Java中集合类层次关系如下:

图 1

如上图,Collection是主要集合类的接口,其子接口(具化接口)有Deque、Queue、Set、List等。

Map是另一种类型的集合,以Key、Value的键值对存储数据集。

在Java 8中,在java.util.Collection接口中添加了如下方法:

Stream<E> stream() {      return StreamSupport.stream(spliterator(), false);  }

stream()方法的可见性修饰符为default,这又是Java 8的新特性。在接口中(Collection为interface),本不需要(也不能)进行方法实现,但引入default修饰后就不同了。开发者不但 可以进行方法的实现,而且还不用考虑向后兼容的问题。关于Default Method的详细解释,读者可以参考Java 8的官方文档。

正是stream方法引出了集合类的聚合操作。

[注意]

Map接口中并没有stream()方法,但是Map的values()和keySet()均返回集合对象,在集合对象上当然是可以使用stream()方法的。

聚合操作实例

为说明聚合操作的使用,首先定义一个数据元素类Person,如下:

import java.time.LocalDate;    public class Person {    String name;    LocalDate birthday;    Sex gender;    String emailAddress;      public int getAge() {     return LocalDate.now().getYear() - birthday.getYear();    }      public void setBirthday(LocalDate birthday){     this.birthday = birthday;    }      public void setGender(Sex sex){     this.gender = sex;    }      public void printPerson() {     System.out.println("The name is " + name);    }      public Sex getGender(){     return gender;    }      public enum Sex {     MALE, FEMALE    }   }

在Java 8以前的版本中,对Person集合的遍历往往采用以下方式:

Set<Person> persons = new HashSet<Person>();

//传统遍历方式 for (Person person : persons) { if (person.getAge() > 18) { System.out.println(person.name + ” is elder than 18.”); } }

同样的功能,在Java 8中使用聚合操作,可以实现如下:

//使用聚合操作  persons.stream().filter(new Predicate<Person>() {      @Override    public boolean test(Person person) {     if (person.getAge() > 18) {      return true;     } else {      return false;     }    }   }).forEach(new Consumer<Person>() {    @Override    public void accept(Person person) {     System.out.println(person.name + " is elder than 18.");    }   });

首先,在集合对象persons上调用stream()方法(聚合操作),取得person对象的数据集(elements),然后调用聚合操作filter()对集合中的元素进行过滤,再调用forEach()完成对符合条件的person的打印。

Predicate和Consumer为Java 8中定义的函数接口(Functional Interface),在java.util.function包下面,函数接口也是Java 8的新特性。在上述代码中,使用了两个匿名类分别对Predicate和Consumer进行了实现,这两个接口都只有一个方法,这也是函数接口的特征之 一。

上述代码中的写法还是比较繁琐的,为进一步简化,可以使用Lambda表达式实现,如下:

// 使用聚合操作及Lambda   persons.stream()    .filter(p -> p.getAge() >= 18)    .forEach(p -> System.out.println(p.name + " is elder than 18."));

因为filter()、forEach()的参数均为函数接口,所以可以替换为Lambda表达式的方式。简单来理解,Lambda表达式就是允许开发者将代码逻辑作为参数进行传递,关于Lambda表达式的详细内容,请参Java 8的官方文档。

聚合操作的使用

聚合操作是Java 8针对集合类,使编程更为便利的方式,可以与Lambda表达式一起使用,达到更加简洁的目的。

前面例子中,对聚合操作的使用可以归结为3个部分:

  1. 数据源部分:通过stream()方法,取得集合对象的数据集。
  2. 通过一系列中间(Intermediate)方法,对数据集进行过滤、检索等数据集的再次处理。如上例中,使用filter()方法来对数据集进行过滤。
  3. 通过最终(terminal)方法完成对数据集中元素的处理。如上例中,使用forEach()完成对过滤后元素的打印。

中间方法除了filter()外,还有distinct()、sorted()、map()等等,其一般是对数据集的整理(过滤、排序、匹配、抽取等等),返回值一般也是数据集。

最终方法往往是完成对数据集中数据的处理,如forEach(),还有allMatch()、anyMatch()、findAny()、 findFirst(),数值计算类的方法有sum、max、min、average等等。最终方法也可以是对集合的处理,如reduce()、 collect()等等。reduce()方法的处理方式一般是每次都产生新的数据集,而collect()方法是在原数据集的基础上进行更新,过程中不 产生新的数据集。

从上面的例子中可以看出,通过stream()方法,从集合对象获取的数据集与集合对象的迭代器(Iterator)有些类似,但他们也不完全相同:

  1. 迭代器提供next()、hasNext()等方法,开发者可以自行控制对元素的处理,以及处理方式,但是只能顺序处理;
  2. stream()方法返回的数据集无next()等方法,开发者无法控制对元素的迭代,迭代方式是系统内部实现的,同时系统内的迭代也不一定是顺序的,还可以并行,如parallelStream()方法。并行的方式在一些情况下,可以大幅提升处理的效率。

除上述介绍的聚合操作外,Java 8中还提供了其他更为丰富的聚合操作,读者可以参考Java 8的开发参考,了解更多内容。

总结

Java 8提供的聚合操作,以及一起使用的Lambda表达式为开发者带来了便利,尤其在面向逻辑易变、开发迭代较快的项目应用时。但笔者个人认为,在带来方便的 同时,可能也带来了一些麻烦,如相同逻辑的复用,以及代码的查错、修改等,当然这些问题也是相对而言的。毕竟,任何事物都有两面性,技术在不断的发 展,Java也在不断地调整自己的适应性,变得功能越来越多,越来越强大了。

 

来源:InfoQ - 赵永