写点什么

Java 8 新特性:全新的 Stream API

  • 2014-12-01
  • 本文字数:2767 字

    阅读完需:约 9 分钟

Java 8 引入了全新的 Stream API。这里的 Stream 和 I/O 流不同,它更像具有 Iterable 的集合类,但行为和集合类又有所不同。

Stream API 引入的目的在于弥补 Java 函数式编程的缺陷。对于很多支持函数式编程的语言,map()、reduce() 基本上都内置到语言的标准库中了,不过,Java 8 的 Stream API 总体来讲仍然是非常完善和强大,足以用很少的代码完成许多复杂的功能。

创建一个 Stream 有很多方法,最简单的方法是把一个 Collection 变成 Stream。我们来看最基本的几个操作:

复制代码
public static void main(String[] args) {
List<Integer> numbers = Arrays.asList(1, 2, 3, 4, 5, 6, 7, 8, 9, 10);
Stream<Integer> stream = numbers.stream();
stream.filter((x) -> {
return x % 2 == 0;
}).map((x) -> {
return x * x;
}).forEach(System.out::println);
}

集合类新增的 stream() 方法用于把一个集合变成 Stream,然后,通过 filter()、map() 等实现 Stream 的变换。Stream 还有一个 forEach() 来完成每个元素的迭代。

为什么不在集合类实现这些操作,而是定义了全新的 Stream API?Oracle 官方给出了几个重要原因:

一是集合类持有的所有元素都是存储在内存中的,非常巨大的集合类会占用大量的内存,而 Stream 的元素却是在访问的时候才被计算出来,这种“延迟计算”的特性有点类似 Clojure 的 lazy-seq,占用内存很少。

二是集合类的迭代逻辑是调用者负责,通常是 for 循环,而 Stream 的迭代是隐含在对 Stream 的各种操作中,例如 map()。

要理解“延迟计算”,不妨创建一个无穷大小的 Stream。

如果要表示自然数集合,显然用集合类是不可能实现的,因为自然数有无穷多个。但是 Stream 可以做到。

自然数集合的规则非常简单,每个元素都是前一个元素的值 +1,因此,自然数发生器用代码实现如下:

复制代码
class NaturalSupplier implements Supplier<Long> {
long value = 0;
public Long get() {
this.value = this.value + 1;
return this.value;
}
}

反复调用 get(),将得到一个无穷数列,利用这个 Supplier,可以创建一个无穷的 Stream:

复制代码
public static void main(String[] args) {
Stream<Long> natural = Stream.generate(new NaturalSupplier());
natural.map((x) -> {
return x * x;
}).limit(10).forEach(System.out::println);
}
{1}

对这个 Stream 做任何 map()、filter() 等操作都是完全可以的,这说明 Stream API 对 Stream 进行转换并生成一个新的 Stream 并非实时计算,而是做了延迟计算。

当然,对这个无穷的 Stream 不能直接调用 forEach(),这样会无限打印下去。但是我们可以利用 limit() 变换,把这个无穷 Stream 变换为有限的 Stream。

利用 Stream API,可以设计更加简单的数据接口。例如,生成斐波那契数列,完全可以用一个无穷流表示(受限 Java 的 long 型大小,可以改为 BigInteger):

复制代码
class FibonacciSupplier implements Supplier<Long> {
long a = 0;
long b = 1;
@Override
public Long get() {
long x = a + b;
a = b;
b = x;
return a;
}
}
public class FibonacciStream {
public static void main(String[] args) {
Stream<Long> fibonacci = Stream.generate(new FibonacciSupplier());
fibonacci.limit(10).forEach(System.out::println);
}
}

如果想取得数列的前 10 项,用 limit(10),如果想取得数列的第 20~30 项,用:

复制代码
List<Long> list = fibonacci.skip(20).limit(10).collect(Collectors.toList());

最后通过 collect() 方法把 Stream 变为 List。该 List 存储的所有元素就已经是计算出的确定的元素了。

用 Stream 表示 Fibonacci 数列,其接口比任何其他接口定义都要来得简单灵活并且高效。

计算π可以利用π的展开式:

复制代码
π/4 = 1 - 1/3 + 1/5 - 1/7 + 1/9 - ...

把π表示为一个无穷 Stream 如下:

复制代码
class PiSupplier implements Supplier<Double> {
double sum = 0.0;
double current = 1.0;
boolean sign = true;
@Override
public Double get() {
sum += (sign ? 4 : -4) / this.current;
this.current = this.current + 2.0;
this.sign = ! this.sign;
return sum;
}
}
Stream<Double> piStream = Stream.generate(new PiSupplier());
piStream.skip(100).limit(10)
.forEach(System.out::println);

这个级数从 100 项开始可以把π的值精确到 3.13~3.15 之间:

复制代码
3.1514934010709914
3.1317889675734545
3.1513011626954057
3.131977491197821
3.1511162471786824
3.1321589012071183
3.150938243930123
3.132333592767332
3.1507667724908344
3.1325019323081857

利用欧拉变换对级数进行加速,可以利用下面的公式:

用代码实现就是把一个流变成另一个流:

复制代码
class EulerTransform implements Function<Double, Double> {
double n1 = 0.0;
double n2 = 0.0;
double n3 = 0.0;
@Override
public Double apply(Double t) {
n1 = n2;
n2 = n3;
n3 = t;
if (n1 == 0.0) {
return 0.0;
}
return calc();
}
double calc() {
double d = n3 - n2;
return n3 - d * d / (n1 - 2 * n2 + n3);
}
}
Stream<Double> piStream2 = Stream.generate(new PiSupplier());
piStream2.map(new EulerTransform())
.limit(10)
.forEach(System.out::println);

可以在 10 项之内把π的值计算到 3.141~3.142 之间:

复制代码
0.0
0.0
3.166666666666667
3.1333333333333337
3.1452380952380956
3.13968253968254
3.1427128427128435
3.1408813408813416
3.142071817071818
3.1412548236077655

还可以多次应用这个加速器:

复制代码
Stream<Double> piStream3 = Stream.generate(new PiSupplier());
piStream3.map(new EulerTransform())
.map(new EulerTransform())
.map(new EulerTransform())
.map(new EulerTransform())
.map(new EulerTransform())
.limit(20)
.forEach(System.out::println);

20 项之内可以计算出极其精确的值:

复制代码
...
3.14159265359053
3.1415926535894667
3.141592653589949
3.141592653589719

可见用 Stream API 可以写出多么简洁的代码,用其他的模型也可以写出来,但是代码会非常复杂。

作者简介

廖雪峰,十年软件开发经验,业余产品经理,精通 Java/Python/Ruby/Visual Basic/Objective C/Lisp 等编程语言,对开源框架有深入研究,著有《Spring 2.0 核心技术与最佳实践》一书,多个业余开源项目托管在 GitHub。


感谢张龙对本文的审校。

给InfoQ 中文站投稿或者参与内容翻译工作,请邮件至 editors@cn.infoq.com 。也欢迎大家通过新浪微博( @InfoQ )或者腾讯微博( @InfoQ )关注我们,并与我们的编辑和其他读者朋友交流。

2014-12-01 07:1120821

评论

发布
暂无评论
发现更多内容

华为云GaussDB深耕数字化下半场,持续打造数据库根技术

华为云开发者联盟

Serverless 云原生 华为云 GaussDB 云数据库

《第8章 函数探幽》

IT蜗壳-Tango

10月月更

为金融场景而生的数据类型:Numeric

青云技术社区

postgresql 云计算 源码 云原生

小红书“致歉滤镜景点”:种草社区的尺度在哪?

石头IT视角

一看就懂|焱融 SaaS 数据服务平台上手指南

焱融科技

云计算 技术 分布式 高性能 文件存储

一文读懂「TTS语音合成技术」

澳鹏Appen

人工智能 语音 nlp 语音合成 TTS

分布式文件系统FastDFS实战

Fox

fastdfs 分布式文件系统

IP地址溯源 从源头遏制计算机恶意程序感染

郑州埃文科技

网络安全 ipv6 IP地址 木马病毒

Tensorflow Lite移动平台编译|Bazel实践

轻口味

人工智能 tensorflow ios android 10月月更

FastDFS环境搭建

Fox

fastdfs

三级等保是不是icp?两者是一样吗?

行云管家

网络安全 等级保护 等保三级 三级等保

数字货币交易所系统软件开发介绍(案例)

Cloud Studio 邀您互动,好礼送不停 | CIF 活动邀请

CODING DevOps

自动化部署 Cloud Studio 开发标准化 可视化编辑 多人协同

全周期数据管控,为「快递大数据+」保驾护航

BinTools图尔兹

LeaRun.Java可视化流程简单配置过程

雯雯写代码

java

技术分享| 音视频多频道使用的正确姿势

anyRTC开发者

音视频 WebRTC 实时通信 多频道

《世界质量报告》重磅发布,人工智能与机器学习成软件质量保证测试焦点

主干开发你必须知道的7件事

华为云开发者联盟

产品 测试 团队 开发 主干开发

滚雪球学 Python 番外篇之游戏世界,游戏也有 Hello World

梦想橡皮擦

10月月更

字节半天*3面/5天拿offer,全凭自身硬实力和这份Java面试笔记

Java 编程 程序员 架构 面试

存储大师班 | 浅谈数据保护之快照与备份

QingStor分布式存储

分布式存储 快照 备份

助力建设智慧社区,EMQ 映云科技服务美好生活

EMQ映云科技

物联网 mqtt 智慧社区

边缘AI方案落地问题探讨

华为云开发者联盟

机器学习 AI 算法 边侧数据 边缘云

数字货币交易软件系统开发介绍(搭建)

直播预告 | Apache APISIX × Apache SkyWalking 线上分享

API7.ai 技术团队

Apache Skywalking API网关 APISIX Meetup

堡垒机的品牌那么多,用哪个品牌更好?

行云管家

云计算 云服务 堡垒机 混合云 云厂商

数字货币交易所系统软件开发介绍(源码)

百度智能云大数据全景架构图如何赋能企业数字化

百度开发者中心

大数据 案例分享 行业创新

现成数字货币交易所源码系统开发

Java 8新特性:全新的Stream API_Java_廖雪峰_InfoQ精选文章