QCon 演讲火热征集中,快来分享技术实践与洞见! 了解详情
写点什么

浅析 Java 8 的聚合操作

  • 2014-06-26
  • 本文字数:2817 字

    阅读完需:约 9 分钟

Oracle 在 2014 年 3 月 19 日如期发布了 Java 8。Java 8 版本被认为是具有里程碑意义的一个版本,Oracle 在该版本中添加了许多新特性,包括 Lambda 表达式、方法引用、加强了安全等等。

在众多的新特性中,聚合操作(Aggregate Operations)是针对集合类的一个比较大的变化。通过聚合操作,开发者可以更容易地使用 Lambda 表达式,并且更方便地实现对集合的查找、遍历、过滤以及常见计算等。

聚合操作与 Java 8 中的 Lambda 表达式、方法引用等新特性是相关的,一般一起组合使用,但这里只说明聚合操作的使用,下面就聚合操作的使用进行简单说明。

集合类的层次结构

集合类是 Java 语言提供的辅助类,是一种较为通用的数据结构,如 Map、Set、List 等。Java 中集合类层次关系如下:

图 1

如上图,Collection 是主要集合类的接口,其子接口(具化接口)有 Deque、Queue、Set、List 等。

Map 是另一种类型的集合,以 Key、Value 的键值对存储数据集。

在 Java 8 中,在 java.util.Collection 接口中添加了如下方法:

复制代码
Stream<E> stream() {
return StreamSupport.stream(spliterator(), false);
}

stream() 方法的可见性修饰符为 default,这又是 Java 8 的新特性。在接口中(Collection 为 interface),本不需要(也不能)进行方法实现,但引入 default 修饰后就不同了。开发者不但可以进行方法的实现,而且还不用考虑向后兼容的问题。关于 Default Method 的详细解释,读者可以参考 Java 8 的官方文档。

正是 stream 方法引出了集合类的聚合操作。

[注意]

Map 接口中并没有 stream() 方法,但是 Map 的 values() 和 keySet() 均返回集合对象,在集合对象上当然是可以使用 stream() 方法的。

聚合操作实例

为说明聚合操作的使用,首先定义一个数据元素类 Person,如下:

复制代码
import java.time.LocalDate;
public class Person {
String name;
LocalDate birthday;
Sex gender;
String emailAddress;
public int getAge() {
return LocalDate.now().getYear() - birthday.getYear();
}
public void setBirthday(LocalDate birthday){
this.birthday = birthday;
}
public void setGender(Sex sex){
this.gender = sex;
}
public void printPerson() {
System.out.println("The name is " + name);
}
public Sex getGender(){
return gender;
}
public enum Sex {
MALE, FEMALE
}
}

在 Java 8 以前的版本中,对 Person 集合的遍历往往采用以下方式:

复制代码
Set<Person> persons = new HashSet<Person>();
<p>// 传统遍历方式 for (Person person : persons) { if (person.getAge() > 18) { System.out.println(person.name + " is elder than 18."); } }</p>

同样的功能,在 Java 8 中使用聚合操作,可以实现如下:

复制代码
// 使用聚合操作
persons.stream().filter(new Predicate<Person>() {
@Override
public boolean test(Person person) {
if (person.getAge() > 18) {
return true;
} else {
return false;
}
}
}).forEach(new Consumer<Person>() {
@Override
public void accept(Person person) {
System.out.println(person.name + " is elder than 18.");
}
});

首先,在集合对象 persons 上调用 stream() 方法(聚合操作),取得 person 对象的数据集(elements),然后调用聚合操作 filter() 对集合中的元素进行过滤,再调用 forEach() 完成对符合条件的 person 的打印。

Predicate 和 Consumer 为 Java 8 中定义的函数接口 (Functional Interface),在 java.util.function 包下面,函数接口也是 Java 8 的新特性。在上述代码中,使用了两个匿名类分别对 Predicate 和 Consumer 进行了实现,这两个接口都只有一个方法,这也是函数接口的特征之一。

上述代码中的写法还是比较繁琐的,为进一步简化,可以使用 Lambda 表达式实现,如下:

复制代码
// 使用聚合操作及 Lambda
persons.stream()
.filter(p -> p.getAge() >= 18)
.forEach(p -> System.out.println(p.name + " is elder than 18."));

因为 filter()、forEach() 的参数均为函数接口,所以可以替换为 Lambda 表达式的方式。简单来理解,Lambda 表达式就是允许开发者将代码逻辑作为参数进行传递,关于 Lambda 表达式的详细内容,请参 Java 8 的官方文档。

聚合操作的使用

聚合操作是 Java 8 针对集合类,使编程更为便利的方式,可以与 Lambda 表达式一起使用,达到更加简洁的目的。

前面例子中,对聚合操作的使用可以归结为 3 个部分:

  1. 数据源部分:通过 stream() 方法,取得集合对象的数据集。
  2. 通过一系列中间(Intermediate)方法,对数据集进行过滤、检索等数据集的再次处理。如上例中,使用 filter() 方法来对数据集进行过滤。
  3. 通过最终(terminal)方法完成对数据集中元素的处理。如上例中,使用 forEach() 完成对过滤后元素的打印。

中间方法除了 filter() 外,还有 distinct()、sorted()、map() 等等,其一般是对数据集的整理(过滤、排序、匹配、抽取等等),返回值一般也是数据集。

最终方法往往是完成对数据集中数据的处理,如 forEach(),还有 allMatch()、anyMatch()、findAny()、findFirst(),数值计算类的方法有 sum、max、min、average 等等。最终方法也可以是对集合的处理,如 reduce()、collect() 等等。reduce() 方法的处理方式一般是每次都产生新的数据集,而 collect() 方法是在原数据集的基础上进行更新,过程中不产生新的数据集。

从上面的例子中可以看出,通过 stream() 方法,从集合对象获取的数据集与集合对象的迭代器(Iterator)有些类似,但他们也不完全相同:

  1. 迭代器提供 next()、hasNext() 等方法,开发者可以自行控制对元素的处理,以及处理方式,但是只能顺序处理;
  2. stream() 方法返回的数据集无 next() 等方法,开发者无法控制对元素的迭代,迭代方式是系统内部实现的,同时系统内的迭代也不一定是顺序的,还可以并行,如 parallelStream() 方法。并行的方式在一些情况下,可以大幅提升处理的效率。

除上述介绍的聚合操作外,Java 8 中还提供了其他更为丰富的聚合操作,读者可以参考 Java 8 的开发参考,了解更多内容。

总结

Java 8 提供的聚合操作,以及一起使用的 Lambda 表达式为开发者带来了便利,尤其在面向逻辑易变、开发迭代较快的项目应用时。但笔者个人认为,在带来方便的同时,可能也带来了一些麻烦,如相同逻辑的复用,以及代码的查错、修改等,当然这些问题也是相对而言的。毕竟,任何事物都有两面性,技术在不断的发展,Java 也在不断地调整自己的适应性,变得功能越来越多,越来越强大了。


感谢张龙对本文的审校。

给InfoQ 中文站投稿或者参与内容翻译工作,请邮件至 editors@cn.infoq.com 。也欢迎大家通过新浪微博( @InfoQ )或者腾讯微博( @InfoQ )关注我们,并与我们的编辑和其他读者朋友交流。

2014-06-26 01:207792

评论

发布
暂无评论
发现更多内容

大模型安全 | 第九期「创造未来,安全同行」度安讲技术沙龙成功举办

百度安全

体验跃升、内部办公应用积极适配,原生鸿蒙在粤蒸蒸日上

最新动态

探索HarmonyOS NEXT实战应用【元服务实战-在线答题】

申公豹

HarmonyOS

JAVA面试题及答案(200问)

Geek_Yin

程序员 面试 java面试 Java面试题 Java面试八股文

如何构建良性的软件供应链生态?看看他们怎么说

OpenAnolis小助手

操作系统 龙蜥社区 龙蜥meetup

OpenAnolis 荣获“2024 年度操作系统领域国内活跃开源项目&开发者”奖项

OpenAnolis小助手

操作系统 龙蜥社区 OpenAnolis

盘点5个常用的.Net依赖注入框架!

快乐非自愿限量之名

.net

Docker Container 可观测性最佳实践

观测云

Docker container

crossover如何永久免费使用?crossover24密钥激活码分享,crossover软件怎么样

阿拉灯神丁

crossover mac 破解版 虚拟机软件 Mac电脑软件 苹果电脑游戏推荐 CrossOver 24

IDM 下载器使用教程,idm破解版永久激活码,idm中文汉化补丁工具

阿拉灯神丁

加速器 IDM idm下载

智能问答模型升级,通义灵码新增图片多模态问答模式等新能力,项目秒上手

阿里云云效

阿里云 云原生

Java多线程处理文件详解与代码示例

不在线第一只蜗牛

Java Python

智谱开源 CogAgent-9B,让 AI「看懂」屏幕;Anthropic:大多数任务无需复杂 AI 智能体

声网

Java面试突击手册,一周刷完这300道面试题,你也可以当架构师!

Summer

Java 程序员 面试 架构师 大厂

《计算机组成及汇编语言原理》阅读笔记:p121-p122

codists

计算机组成及汇编语言原理

亚马逊云科技 | Amazon Nova:智能技术新势力

伊克罗德信息科技

2024过去了,留下十个科技记忆

脑极体

AI

知乎,什么时候能“上桌”?

趣解商业

互联网 软件 知乎

大模型推理引擎国产化思考和实践

京东零售技术

芯片 大模型

圣诞树的装饰挑战:非线性分析能阻止圣诞树倒塌吗?

Altair RapidMiner

设计 仿真 altair Hypermesh

昨天刚面完字节——面试经验和总结(已拿offer)

Geek_Yin

程序员 java面试 字节 Java面试题 Java面试八股文

“浪潮信息-龙蜥技术认证”走进成都东软学院,证书与学分互认互通

OpenAnolis小助手

操作系统 龙蜥社区 龙蜥meetup 龙蜥技术认证

阿里P9架构师终于把毕生心血而成的分布式高可用算法笔记开源了

程序员高级码农

Java 分布式 算法 java面试 Java面试题

阿里人在Github分享的Spring Cloud全栈笔记,你想象不到有多全!

Summer

Java 程序员 面试 架构师 大厂

剖析 Crypto Rumble 游戏测试活动规则,如何从中获得最大化奖励?

股市老人

Amazon Bedrock 实践 - 利用 Llama 3.2 模型分析全球糖尿病趋势

亚马逊云科技 (Amazon Web Services)

机器学习 -python Amazon Bedrock 生成式 AI 应用

阿里P8架构师强推java程序员人手一套116页JVM吊打面试官专属秘籍

程序员高级码农

Java 编程 程序员 java面试 Java面试题

浅析Java 8的聚合操作_Java_赵永_InfoQ精选文章