写点什么

谷歌官方解读:TensorFlow 2.0 哪些新特性值得关注?

  • 2019-01-16
  • 本文字数:3253 字

    阅读完需:约 11 分钟

谷歌官方解读:TensorFlow 2.0哪些新特性值得关注?

2018 年 11 月,TensorFlow 在庆祝 3 岁生日时回顾了其多年来增加的功能。 对于即将发布的 TensorFlow 2.0,TensorFlow 团队感到非常兴奋。相比于旧版本,这个被团队视为另一重要里程碑的版本又新增了哪些功能呢?


TensorFlow 2.0 将专注于简单性和易用性,具体更新包括:


  • 使用 Keras 和 eager execution 轻松建模。

  • 在任何平台生产中部署强大的模型。

  • 强大的研究实验。

  • 清理弃用的 API,减少重复,简化 API。


在过去几年中,我们为 TensorFlow 添加了许多组件。TensorFlow 2.0 将这些组件打包成一个综合平台,支持从训练到部署的整个机器学习工作流程。TensorFlow 2.0 新架构示意图如下:



(注意:虽然此图的训练部分侧重于 Python API,但 TensorFlow.js 也支持训练模型。TensorFlow 2.0 还对其他语言有不同程度的支持,包括 Swift、R 和 Julia。)

更简单地创建模型

在最近的博客文章中,我们宣布 Keras 是一个用户友好的机器学习 API 标准,并将成为用于构建和训练模型最重要的高级 API。Keras API 让你可以轻松开始使用 TensorFlow。重要的是,Keras 提供了一些模型创建 API(顺序、功能和子类),让用户可以为项目选择合适的抽象级别。TensorFlow 的实现增强包括 eager execution、快速迭代和直接调试,以及用于构建可扩展输入管道的 tf.data。


以下为示例工作流程(在接下来的几个月中,我们将努力更新链接的中指南):


  1. 使用 tf.data 加载数据;使用由 tf.data 创建的输入管道读取训练数据;使用 tf.feature_column 描述特征特点,例如分段和特征交叉;支持来自内存数据的便捷输入(例如,NumPy)。

  2. 使用 tf.keras 或预先做好的评估器构建、训练和验证你的模型。 Keras 与 TensorFlow 的其余部分紧密集成,因此可以随时访问 TensorFlow 的功能。还可以直接使用一组标准的打包模型(例如,线性或逻辑回归、梯度提升树、随机森林,用 tf.estimator API 实现)。如果你不想从头开始训练模型,不久之后你就可以用迁移学习来训练使用 TensorFlow Hub 模块的 Keras 或评估器模型。

  3. 运行 eager execution 和调试,然后使用 tf.function(图形)。默认情况下,TensorFlow 2.0 以 eager execution 的方式运行,以便于使用和调试。此外,tf.function 注释将你的 Python 程序完全透明地转换为 TensorFlow 图形。此过程保留了 1.x TensorFlow 基于图形运行的所有优点:在性能优化、远程运行和轻松序列化、导出和部署的同时,使用简单的 Python 让程序表达更加灵活易用。

  4. 使用分布策略进行分布式训练。对于大型机器学习训练任务,分布式策略 API 可以轻松地在不同硬件配置上分发和训练模型,而无需更改模型定义。由于 TensorFlow 支持各种硬件加速器,如 CPU、GPU 和 TPU,因此你可以将训练工作负载分配到单节点/多加速器以及多节点/多加速器配置(包括 TPU Pod)。此 API 支持各种群集配置,还提供在本地或云环境中部署 Kubernetes 群集训练的模板。

  5. 导出到 SavedModel。 TensorFlow 将 SavedModel 标准化并作为 TensorFlow Serving、TensorFlow Lite、TensorFlow.js、TensorFlow Hub 等的交换格式。

在任何平台生产中部署模型

TensorFlow 一直以来都可以直接用于生产。无论是在服务器、边缘设备还是 Web 上,TensorFlow 都可以让你轻松地训练和部署模型,无论使用何种语言或平台。在 TensorFlow 2.0 中,我们通过标准化交换格式和对齐 API 来提高跨平台和组件的兼容性和匹配性。


训练并保存模型后,你可以直接在应用程序中运行,也可以使用以下任意一个部署库为其提供服务:


  • TensorFlow Serving:TensorFlow 库,可以通过 HTTP / REST 或 gRPC /协议缓冲区提供模型。

  • TensorFlow Lite:TensorFlow 针对移动和嵌入式设备的轻量级解决方案,提供了在 Android、iOS 和嵌入式系统(如 Raspberry Pi 和 Edge TPU)上部署模型的功能。

  • TensorFlow.js:让开发者可以在 JavaScript 环境中部署模型,例如通过 Node.js 在 Web 浏览器或服务器端部署模型。TensorFlow.js 还支持使用类似 Keras 的 API 在 JavaScript 中定义模型并直接在 Web 浏览器中进行训练。


TensorFlow 还支持其他语言(其中一些由更广泛的社区维护),包括 C、Java、Go、C#、Rust、Julia、R 等。

强大的研究实验

TensorFlow 可以轻松地把新创意转换为代码。TensorFlow 2.0 集成了许多功能,可以在不牺牲速度或性能的情况下定义和训练最先进的模型:


  • Keras Functional API 和 Model Subclassing API:允许创建复杂的拓扑,包括使用残差层、自定义多输入/输出模型以及命令式写入的前向传递。

  • 自定义训练逻辑:使用 tf.GradientTape 和 tf.custom_gradient 对梯度计算进行细粒度控制。

  • 为了更灵活和易于控制,旧版本的 TensorFlow API 可以一直继续使用,并与更高级别的抽象结合,以实现完全可定制的逻辑。


TensorFlow 2.0 新增了一些功能,让研究人员和高级用户可以进行实验,使用丰富的扩展,如 Ragged Tensors、TensorFlow Probability、Tensor2Tensor 等。


除了这些功能外,TensorFlow 还提供了让原型设计和调试更简单的 eager execution,分发策略 API 和 AutoGraph,可以进行大规模训练并支持 TPU,使 TensorFlow 2.0 成为一个易于使用、可定制、高度可扩展,可以运行并将最先进机器学习研究转化为实际生产的平台。

TensorFlow 1.x 和 2.0 之间的差异

自从首次开源以来, TensorFlow 已经有许多版本和 API 迭代。TensorFlow 2.0 可以基于语义版本控制(semantic versioning)清理和模块化平台。


以下是一些较大的变化:



此外,tf.contrib 将从核心 TensorFlow 存储库和构建过程中删除。TensorFlow 的 contrib 模块不断增长,单个存储库已经难以维护和支持。较大的项目可以更好地进行单独维护,而较小的扩展将逐渐转向核心 TensorFlow 代码。我们还创建了一个特殊族群(SIG,special interest group)来维护并进一步开发一些更重要的贡献项目。如果你有兴趣参与,请参与此 RFC:https://github.com/tensorflow/community/pull/37

兼容性和连续性

为了简化 TensorFlow 2.0 迁移,我们提供了一个转换工具,它可以更新 TensorFlow 1.x Python 代码,以兼容 TensorFlow 2.0 API,或者标记代码无法自动转换的情况。


并非所有更改都可以完全自动完成。例如,某些已弃用的 API 没有替换项。这就是我们引入 tensorflow.compat.v1 兼容性模块的原因,该模块保留了对完整 TensorFlow 1.x API(不包括 tf.contrib)的支持。该模块将在 TensorFlow 2.x 的生命周期内运行,让使用 TensorFlow 1.x 编写的代码继续运作。


此外,SavedModels 或存储的 GraphDefs 将向后兼容。使用 1.x 版本保存的 SavedModels 仍可以在 2.x 中加载和执行。但是,2.0 中的变更可能会导致原始检查点中的变量名称更改,因此,无法保证 2.0 之前版本的检查点正常工作。有关详细信息,请参阅 Effective TensorFlow 2.0 指南 https://github.com/tensorflow/docs/blob/master/site/en/r2/guide/effective_tf2.md


我们相信,TensorFlow 2.0 将为社区带来巨大的利益,并投入大量精力让转换变得尽可能简单。但是,我们也认识到,迁移当前的管道需要时间。因此,我们将在最后的 1.x 版本中提供 12 个月的安全补丁,以便现有用户有充足的时间进行过渡。

TensorFlow 2.0 时间表

TensorFlow 2.0 将于今年年初发布公开预览版。但为什么要等呢?现在,你已经可以通过使用 tf.keras 和 eager execution,预打包模型和部署库来开发 TensorFlow 2.0。分发策略 API 目前已部分可用。


我们对 TensorFlow 2.0 以及即将发生的变化感到非常兴奋。TensorFlow 已经从一个深度学习软件库开发,成长为适用于所有类型机器学习的整个生态系统。TensorFlow 2.0 将变得简单易用,适用于所有平台上的所有用户。


参考链接:


https://medium.com/tensorflow/whats-coming-in-tensorflow-2-0-d3663832e9b8


极客时间《TensorFlow快速入门与实战》专栏


2019-01-16 07:009214
用户头像

发布了 98 篇内容, 共 66.9 次阅读, 收获喜欢 285 次。

关注

评论

发布
暂无评论
发现更多内容

百度工程师教你快速提升研发效率小技巧

百度Geek说

前端

2022年4月中国数据库排行榜:华为GaussDB 挺进前四,榜单前八得分扶摇直上

墨天轮

数据库 国产数据库 达梦 人大金仓 gbase8a

【技术加油站】浅谈百度智能测试的三个阶段

百度Geek说

测试

使用ORM与原始SQL的性能对比

杨彦星

Python MySQL sanic

Cisco Nexus L2 Switch 进行 vPC 和 L3 改造以支持 K8S 部署

Qunar技术沙龙

#运维

架构实战营模块九毕业项目

刘洋

#架构实战营 架构师实战营 「架构实战营」

百度程序员开发避坑指南(3)

百度Geek说

前端

基于云效Flow配置 Jenkins 源

阿里云云效

云计算 阿里云 运维 jenkins、 jenkins高级用法

P5直升P7!“阿里爸爸”最新出品年薪30W~120WJava架构师学习路线

Java全栈架构师

程序人生 IT java程序员 java面试 java架构

netty系列之:netty中的frame解码器

程序那些事

Netty 程序那些事 java 4月月更

四川数字经济发展分析:四川21市州数字经济发展活跃度解密

易观分析

数字化转型 数字化经济

多方安全计算升级数据治理技术体系需考虑数据源合规性等

易观分析

多方安全计算

4. 堪比JMeter的.Net压测工具 - Crank 进阶篇 - 认识wrk、wrk2

MASA技术团队

C# .net 微软 测试 压测

ironSource 发行解决方案 Supersonic 两周年,游戏全球下载量突破 20 亿

极客天地

ArduBee|开源技术背后的创新

科技热闻

数据挖掘:针对小样本与不均衡样本的机器学习算法实践

鲸品堂

数据挖掘

Kernel SIG直播:让人头疼的“内核内存被改”和“内存泄露”怎么解?|第13期

OpenAnolis小助手

直播 内核 龙蜥社区 sig 龙蜥大讲堂

详解离线数仓和实时数仓的区别

五分钟学大数据

4月月更

TiDB源码系列之沉浸式编译TiDB

TiDB 社区干货传送门

不解决好这 3 大矛盾,就别搞 DevOps 了

飞算JavaAI开发助手

公司产品手册的编写方法

小炮

企业 产品宣传手册

测试权限

石子头

SVGIcon 组件的构建与使用

全象云低代码

前端 低代码 SVG 低代码平台 图标库

如何成为更好的AI专业人员?请查收这7条实战经验

Baihai IDP

人工智能 算法 数据科学

开源分布式图数据库的思考和实践

NebulaGraph

图数据库 知识图谱

Pulsar Summit Asia 2021|Pulsar在移动云智能运维平台的实践

移动云大数据

pulsar

搭建一个可视化看板,仅需4步

阿里云云效

云计算 阿里云 看板 研发团队 可视化看板

《对话ACE》第二期:新数据库时代,DBA发展之路该如何选择

OceanBase 数据库

dba oceanbase

2022观测云产品发布会前瞻:这是一份给IT工程师们的礼物

观测云

知名固件供应商百敖软件加入龙蜥社区

OpenAnolis小助手

开源 生态 龙蜥社区 CLA 百敖软件

恒源云(Gpushare)_炼丹萌新指南,这次错不了!

恒源云

深度学习 GPU算力 算法训练

谷歌官方解读:TensorFlow 2.0哪些新特性值得关注?_编程语言_TensorFlow团队_InfoQ精选文章