写点什么

浅析 Java 8 的聚合操作

  • 2014-06-26
  • 本文字数:2817 字

    阅读完需:约 9 分钟

Oracle 在 2014 年 3 月 19 日如期发布了 Java 8。Java 8 版本被认为是具有里程碑意义的一个版本,Oracle 在该版本中添加了许多新特性,包括 Lambda 表达式、方法引用、加强了安全等等。

在众多的新特性中,聚合操作(Aggregate Operations)是针对集合类的一个比较大的变化。通过聚合操作,开发者可以更容易地使用 Lambda 表达式,并且更方便地实现对集合的查找、遍历、过滤以及常见计算等。

聚合操作与 Java 8 中的 Lambda 表达式、方法引用等新特性是相关的,一般一起组合使用,但这里只说明聚合操作的使用,下面就聚合操作的使用进行简单说明。

集合类的层次结构

集合类是 Java 语言提供的辅助类,是一种较为通用的数据结构,如 Map、Set、List 等。Java 中集合类层次关系如下:

图 1

如上图,Collection 是主要集合类的接口,其子接口(具化接口)有 Deque、Queue、Set、List 等。

Map 是另一种类型的集合,以 Key、Value 的键值对存储数据集。

在 Java 8 中,在 java.util.Collection 接口中添加了如下方法:

复制代码
Stream<E> stream() {
return StreamSupport.stream(spliterator(), false);
}

stream() 方法的可见性修饰符为 default,这又是 Java 8 的新特性。在接口中(Collection 为 interface),本不需要(也不能)进行方法实现,但引入 default 修饰后就不同了。开发者不但可以进行方法的实现,而且还不用考虑向后兼容的问题。关于 Default Method 的详细解释,读者可以参考 Java 8 的官方文档。

正是 stream 方法引出了集合类的聚合操作。

[注意]

Map 接口中并没有 stream() 方法,但是 Map 的 values() 和 keySet() 均返回集合对象,在集合对象上当然是可以使用 stream() 方法的。

聚合操作实例

为说明聚合操作的使用,首先定义一个数据元素类 Person,如下:

复制代码
import java.time.LocalDate;
public class Person {
String name;
LocalDate birthday;
Sex gender;
String emailAddress;
public int getAge() {
return LocalDate.now().getYear() - birthday.getYear();
}
public void setBirthday(LocalDate birthday){
this.birthday = birthday;
}
public void setGender(Sex sex){
this.gender = sex;
}
public void printPerson() {
System.out.println("The name is " + name);
}
public Sex getGender(){
return gender;
}
public enum Sex {
MALE, FEMALE
}
}

在 Java 8 以前的版本中,对 Person 集合的遍历往往采用以下方式:

复制代码
Set<Person> persons = new HashSet<Person>();
<p>// 传统遍历方式 for (Person person : persons) { if (person.getAge() > 18) { System.out.println(person.name + " is elder than 18."); } }</p>

同样的功能,在 Java 8 中使用聚合操作,可以实现如下:

复制代码
// 使用聚合操作
persons.stream().filter(new Predicate<Person>() {
@Override
public boolean test(Person person) {
if (person.getAge() > 18) {
return true;
} else {
return false;
}
}
}).forEach(new Consumer<Person>() {
@Override
public void accept(Person person) {
System.out.println(person.name + " is elder than 18.");
}
});

首先,在集合对象 persons 上调用 stream() 方法(聚合操作),取得 person 对象的数据集(elements),然后调用聚合操作 filter() 对集合中的元素进行过滤,再调用 forEach() 完成对符合条件的 person 的打印。

Predicate 和 Consumer 为 Java 8 中定义的函数接口 (Functional Interface),在 java.util.function 包下面,函数接口也是 Java 8 的新特性。在上述代码中,使用了两个匿名类分别对 Predicate 和 Consumer 进行了实现,这两个接口都只有一个方法,这也是函数接口的特征之一。

上述代码中的写法还是比较繁琐的,为进一步简化,可以使用 Lambda 表达式实现,如下:

复制代码
// 使用聚合操作及 Lambda
persons.stream()
.filter(p -> p.getAge() >= 18)
.forEach(p -> System.out.println(p.name + " is elder than 18."));

因为 filter()、forEach() 的参数均为函数接口,所以可以替换为 Lambda 表达式的方式。简单来理解,Lambda 表达式就是允许开发者将代码逻辑作为参数进行传递,关于 Lambda 表达式的详细内容,请参 Java 8 的官方文档。

聚合操作的使用

聚合操作是 Java 8 针对集合类,使编程更为便利的方式,可以与 Lambda 表达式一起使用,达到更加简洁的目的。

前面例子中,对聚合操作的使用可以归结为 3 个部分:

  1. 数据源部分:通过 stream() 方法,取得集合对象的数据集。
  2. 通过一系列中间(Intermediate)方法,对数据集进行过滤、检索等数据集的再次处理。如上例中,使用 filter() 方法来对数据集进行过滤。
  3. 通过最终(terminal)方法完成对数据集中元素的处理。如上例中,使用 forEach() 完成对过滤后元素的打印。

中间方法除了 filter() 外,还有 distinct()、sorted()、map() 等等,其一般是对数据集的整理(过滤、排序、匹配、抽取等等),返回值一般也是数据集。

最终方法往往是完成对数据集中数据的处理,如 forEach(),还有 allMatch()、anyMatch()、findAny()、findFirst(),数值计算类的方法有 sum、max、min、average 等等。最终方法也可以是对集合的处理,如 reduce()、collect() 等等。reduce() 方法的处理方式一般是每次都产生新的数据集,而 collect() 方法是在原数据集的基础上进行更新,过程中不产生新的数据集。

从上面的例子中可以看出,通过 stream() 方法,从集合对象获取的数据集与集合对象的迭代器(Iterator)有些类似,但他们也不完全相同:

  1. 迭代器提供 next()、hasNext() 等方法,开发者可以自行控制对元素的处理,以及处理方式,但是只能顺序处理;
  2. stream() 方法返回的数据集无 next() 等方法,开发者无法控制对元素的迭代,迭代方式是系统内部实现的,同时系统内的迭代也不一定是顺序的,还可以并行,如 parallelStream() 方法。并行的方式在一些情况下,可以大幅提升处理的效率。

除上述介绍的聚合操作外,Java 8 中还提供了其他更为丰富的聚合操作,读者可以参考 Java 8 的开发参考,了解更多内容。

总结

Java 8 提供的聚合操作,以及一起使用的 Lambda 表达式为开发者带来了便利,尤其在面向逻辑易变、开发迭代较快的项目应用时。但笔者个人认为,在带来方便的同时,可能也带来了一些麻烦,如相同逻辑的复用,以及代码的查错、修改等,当然这些问题也是相对而言的。毕竟,任何事物都有两面性,技术在不断的发展,Java 也在不断地调整自己的适应性,变得功能越来越多,越来越强大了。


感谢张龙对本文的审校。

给InfoQ 中文站投稿或者参与内容翻译工作,请邮件至 editors@cn.infoq.com 。也欢迎大家通过新浪微博( @InfoQ )或者腾讯微博( @InfoQ )关注我们,并与我们的编辑和其他读者朋友交流。

2014-06-26 01:207920

评论

发布
暂无评论
发现更多内容

查看mac电脑的温度信息, 并且给mac电脑降温

lmymirror

macos Mac terminal

Java源码系列1——ArrayList

超超不会飞

Java

国庆假期快来了,打开8天长假的正确方式是...

老胡爱分享

读书 书籍推荐 随笔杂谈

奈学:Java 和 JavaScript 是什么关系?

奈学教育

Java

10多家公司的Java开发面试常见问题合集

Java架构师迁哥

融云技术分享:基于WebRTC的实时音视频首帧显示时间优化实践

JackJiang

音视频 即时通讯 实时通信

linux 文件权限控制

kcnf

linux 文件权限控制 acl

浅谈滴滴需求响应式公交背后的技术

滴滴技术

滴滴技术 创新公交 路径优化

倒计时!Pulsar Summit Asia 2020 演讲征集

Apache Pulsar

开源 云原生 pulsar Apache Pulsar 消息中间件

2020年行摄回忆录(上)

穿过生命散发芬芳

生活 摄影

java安全编码指南之:异常处理

程序那些事

java安全编码 java安全 java安全编码指南

看看别人是怎么面试蚂蚁金服的!社招Java面经分享

Java架构师迁哥

Java 阿里巴巴 面试 蚂蚁金服

架构1期第三周作业二

道长

极客大学架构师训练营

不一样的面向对象(三)

书旅

php 面向对象 面向对象编程

JAVA集合之ConcurrentHashMap

彭阿三

Java JAVA集合

信息公交服务在滴滴的应用实践

滴滴技术

滴滴技术 人工只能 信息公交 路径优化

Spring 5 中文解析数据存储篇-JDBC数据存储(下)

青年IT男

Spring5

Go编程(一) 怎么写Go代码

dongfanger

编程 开发 Go 语言

一篇文章搞定 Nginx 反向代理与负载均衡

哈喽沃德先生

nginx 负载均衡 反向代理 服务器 正向代理与反向代理

StreamNative 宣布开源 MoP:Apache Pulsar 支持原生 MQTT 协议

Apache Pulsar

开源 云原生 mqtt Apache Pulsar 消息中间件

数据挖掘技术在轨迹数据上的应用实践

滴滴技术

人工智能 数据挖掘 滴滴技术 轨道技术 创新公交

DàYé玩转数据战略Step By Step

曲水流觞TechRill

数据中台 数字化

聊一下《技术力量-一线技术团队成功启示录》

Man

中台 研发管理

点对点音视频应用场景及优势

anyRTC开发者

音视频 WebRTC 直播 RTC 安卓

甲方日常 24

句子

工作 随笔杂谈 日常

比曲婉婷云尽孝更可怕的是:2020年,低收入家庭仍然在被收割

成周

心理学 教育 培训 维权 曲婉婷

Go编程(二) 多线程简单斗地主

dongfanger

编程 开发 Go 语言

图解 K8S 源码 - Deployment Controller 篇

郭旭东

Kubernetes Kubernetes源码

2020面试阿里字节跳动90%被问到的JVM面试题附答案

Java架构师迁哥

奈学:Java 和 JavaScript 是什么关系?

古月木易

Java

初学源码之——Spring IOC 应用

Java架构师迁哥

浅析Java 8的聚合操作_Java_赵永_InfoQ精选文章