Java 8 聚合操作详解
Oracle在2014年3月19日如期发布了Java 8。Java 8版本被认为是具有里程碑意义的一个版本,Oracle在该版本中添加了许多新特性,包括Lambda表达式、方法引用、加强了安全等等。
在众多的新特性中,聚合操作(Aggregate Operations)是针对集合类的一个比较大的变化。通过聚合操作,开发者可以更容易地使用Lambda表达式,并且更方便地实现对集合的查找、遍历、过滤以及常见计算等。
聚合操作与Java 8中的Lambda表达式、方法引用等新特性是相关的,一般一起组合使用,但这里只说明聚合操作的使用,下面就聚合操作的使用进行简单说明。
集合类的层次结构
集合类是Java语言提供的辅助类,是一种较为通用的数据结构,如Map、Set、List等。Java中集合类层次关系如下:
图 1
如上图,Collection是主要集合类的接口,其子接口(具化接口)有Deque、Queue、Set、List等。
Map是另一种类型的集合,以Key、Value的键值对存储数据集。
在Java 8中,在java.util.Collection接口中添加了如下方法:
Stream<E> stream() { return StreamSupport.stream(spliterator(), false); }
stream()方法的可见性修饰符为default,这又是Java 8的新特性。在接口中(Collection为interface),本不需要(也不能)进行方法实现,但引入default修饰后就不同了。开发者不但 可以进行方法的实现,而且还不用考虑向后兼容的问题。关于Default Method的详细解释,读者可以参考Java 8的官方文档。
正是stream方法引出了集合类的聚合操作。
[注意]
Map接口中并没有stream()方法,但是Map的values()和keySet()均返回集合对象,在集合对象上当然是可以使用stream()方法的。
聚合操作实例
为说明聚合操作的使用,首先定义一个数据元素类Person,如下:
import java.time.LocalDate; public class Person { String name; LocalDate birthday; Sex gender; String emailAddress; public int getAge() { return LocalDate.now().getYear() - birthday.getYear(); } public void setBirthday(LocalDate birthday){ this.birthday = birthday; } public void setGender(Sex sex){ this.gender = sex; } public void printPerson() { System.out.println("The name is " + name); } public Sex getGender(){ return gender; } public enum Sex { MALE, FEMALE } }
在Java 8以前的版本中,对Person集合的遍历往往采用以下方式:
Set<Person> persons = new HashSet<Person>();
//传统遍历方式 for (Person person : persons) { if (person.getAge() > 18) { System.out.println(person.name + ” is elder than 18.”); } }
同样的功能,在Java 8中使用聚合操作,可以实现如下:
//使用聚合操作 persons.stream().filter(new Predicate<Person>() { @Override public boolean test(Person person) { if (person.getAge() > 18) { return true; } else { return false; } } }).forEach(new Consumer<Person>() { @Override public void accept(Person person) { System.out.println(person.name + " is elder than 18."); } });
首先,在集合对象persons上调用stream()方法(聚合操作),取得person对象的数据集(elements),然后调用聚合操作filter()对集合中的元素进行过滤,再调用forEach()完成对符合条件的person的打印。
Predicate和Consumer为Java 8中定义的函数接口(Functional Interface),在java.util.function包下面,函数接口也是Java 8的新特性。在上述代码中,使用了两个匿名类分别对Predicate和Consumer进行了实现,这两个接口都只有一个方法,这也是函数接口的特征之 一。
上述代码中的写法还是比较繁琐的,为进一步简化,可以使用Lambda表达式实现,如下:
// 使用聚合操作及Lambda persons.stream() .filter(p -> p.getAge() >= 18) .forEach(p -> System.out.println(p.name + " is elder than 18."));
因为filter()、forEach()的参数均为函数接口,所以可以替换为Lambda表达式的方式。简单来理解,Lambda表达式就是允许开发者将代码逻辑作为参数进行传递,关于Lambda表达式的详细内容,请参Java 8的官方文档。
聚合操作的使用
聚合操作是Java 8针对集合类,使编程更为便利的方式,可以与Lambda表达式一起使用,达到更加简洁的目的。
前面例子中,对聚合操作的使用可以归结为3个部分:
- 数据源部分:通过stream()方法,取得集合对象的数据集。
- 通过一系列中间(Intermediate)方法,对数据集进行过滤、检索等数据集的再次处理。如上例中,使用filter()方法来对数据集进行过滤。
- 通过最终(terminal)方法完成对数据集中元素的处理。如上例中,使用forEach()完成对过滤后元素的打印。
中间方法除了filter()外,还有distinct()、sorted()、map()等等,其一般是对数据集的整理(过滤、排序、匹配、抽取等等),返回值一般也是数据集。
最终方法往往是完成对数据集中数据的处理,如forEach(),还有allMatch()、anyMatch()、findAny()、 findFirst(),数值计算类的方法有sum、max、min、average等等。最终方法也可以是对集合的处理,如reduce()、 collect()等等。reduce()方法的处理方式一般是每次都产生新的数据集,而collect()方法是在原数据集的基础上进行更新,过程中不 产生新的数据集。
从上面的例子中可以看出,通过stream()方法,从集合对象获取的数据集与集合对象的迭代器(Iterator)有些类似,但他们也不完全相同:
- 迭代器提供next()、hasNext()等方法,开发者可以自行控制对元素的处理,以及处理方式,但是只能顺序处理;
- stream()方法返回的数据集无next()等方法,开发者无法控制对元素的迭代,迭代方式是系统内部实现的,同时系统内的迭代也不一定是顺序的,还可以并行,如parallelStream()方法。并行的方式在一些情况下,可以大幅提升处理的效率。
除上述介绍的聚合操作外,Java 8中还提供了其他更为丰富的聚合操作,读者可以参考Java 8的开发参考,了解更多内容。
总结
Java 8提供的聚合操作,以及一起使用的Lambda表达式为开发者带来了便利,尤其在面向逻辑易变、开发迭代较快的项目应用时。但笔者个人认为,在带来方便的 同时,可能也带来了一些麻烦,如相同逻辑的复用,以及代码的查错、修改等,当然这些问题也是相对而言的。毕竟,任何事物都有两面性,技术在不断的发 展,Java也在不断地调整自己的适应性,变得功能越来越多,越来越强大了。
来源:InfoQ - 赵永