TensorFlow 2.4 Mac 优化版:性能大幅提升,可在最新的M1芯片上运行

2020 年 11 月 25 日

TensorFlow 2.4 Mac 优化版:性能大幅提升,可在最新的M1芯片上运行

通过 TensorFlow 2 在各种不同的平台、设备和硬件上提供一流的训练性能,使开发人员、工程师和研究人员能够在他们喜欢的平台上工作。TensorFlow 用户现在可以在搭载 Intel CPU 的 Mac 或搭载 Apple 新芯片 M1 的 Mac 上使用 TensorFlow 2.4 Mac 优化版 和新的 ML Compute(机器学习计算)框架进行加速训练。这些改进,加上 Apple 开发人员可以通过 TensorFlow Lite 在 iOS 上执行 TensorFlow,继续展示了 TensorFlow 在 Apple 硬件上支持高性能机器学习执行的广度和深度。

使用 ML Compute 在 Mac 上的性能


Mac 一直是开发人员、工程师和研究人员所喜爱的平台。随着 Apple 上周宣布 推出一系列采用新芯片 M1 的 Mac 计算机,TensorFlow 2.4 Mac 优化版充分利用了 Mac 的全部能力,在性能上有了巨大的飞跃。


ML Compute 是 Apple 推出的新框架,它支持在 Mac 上进行 TensorFlow 模型的训练,现在你可以在搭载 M1 或 Intel CPU 的 Mac 计算机上利用加速的 CPU 和 GPU 进行训练。


例如,M1 芯片包含了一个强大的新 8 核 CPU 和多达 8 核的 GPU,这些都是针对 Mac 计算机上的机器学习训练任务而优化的。在下面的图表中,你可以看到 TensorFlow 2.4 Mac 优化版在流行的搭载 M1 和 Intel CPU 的 Mac 上如何实现巨大的性能提升的。


在搭载 M1 和 Intel CPU 的 13 英寸 MacBook Pro 上,使用 ML Compute 的常见机型的训练效果以秒为单位显示,数字越小表明训练时间越短。


在搭载 Intel CPU 的 MacPro 2019 款上使用 ML Compute 对常见机型的训练效果以秒为单位显示,数字越小表明训练时间越短。

TensorFlow Apple Mac 优化版入门


用户无需对现有的 TensorFlow 脚本进行任何更改,就可以使用 ML Compute 作为 TensorFlow 和 TensorFlow 插件的后端。


首先,请访问 Apple 的 GitHub 仓库,了解如何下载并安装 TensorFlow 2.4 Apple Mac 优化版分叉(fork)的说明。


在不久的将来,Apple 将通过分叉版本集成到 TensorFlow 主分支 中,使这样的更新更容易让用户获得这些性能数据。


你可以在 Apple 的机器学习网站上了解更多关于 ML Compute 框架的信息。


原文链接:


https://blog.tensorflow.org/2020/11/accelerating-tensorflow-performance-on-mac.html


2020 年 11 月 25 日 10:041115

评论

发布
暂无评论
发现更多内容

Week 5学习总结

balsamspear

极客大学架构师训练营

手动造轮子——基于.NetCore的RPC框架DotNetCoreRpc

yi念之间

RPC ASP.NET Core

英特尔首批独显笔记本亮相,非凡S3x纵享轻薄新体验

intel001

蚂蚁金融推迟上市:互联网金融是否要遭遇滑铁卢

石头IT视角

JVM真香系列:.java文件到.class文件

田维常

JVM

阿里P8对Thread核心源码讲解

Java架构师迁哥

DDIA 读书笔记(5)数据分区方案

莫黎

读书笔记

【Knative系列】一文读懂 Knative Serving扩缩容的原理

Chumper

Serverless knative autoscaler kantive

搭载设计师级独显英特尔Xe MAX,非凡S3x体验全能创作

intel001

互联网审判中区块链存证技术的应用进路

CECBC区块链专委会

互联网 电子存证

“十三五”收官,区块链赋能能源电力路在何方?

CECBC区块链专委会

区块链 电力 能源

Android 一行代码接入扫码功能 (CameraX + zxing)

Java android kotlin zxing camera

【性能优化】纳尼?内存又溢出了?!是时候总结一波了!!

冰河

性能优化 内存泄露 高并发 高性能 内存溢出

英特尔进军独显领域,第一批搭载锐炬®Xe MAX独显轻薄本已问世!

intel001

数字货币交易所开发技术,场外币币交易平台搭建app

WX13823153201

数字货币交易所开发

ViewportFrame demo

katichar

天源迪科受邀出席“第四届央企电商化采购发展高峰论坛"

DT极客

Dubbo-go Server端开启服务过程

apache/dubbo-go

dubbo dubbo-go dubbogo

手动造轮子——为Ocelot集成Nacos注册中心

yi念之间

nacos ASP.NET Core Ocelot

Flink 1.11 与 Hive 批流一体数仓实践

Apache Flink

flink 流计算 实时计算

性能测试,简单的压测工具

garlic

极客大学架构师训练营

http请求中get和post方法的区别

测试人生路

HTTP post GET

25个小众的Java库

GuoYaxiang

Java 开发工具

线上Java程序占用 CPU 过高,请说一下排查方法?

古时的风筝

Java JVM cpu 100%

darknet A版安装

Dreamer

Week 5命题作业

balsamspear

极客大学架构师训练营

响应式编程简介之:Reactor

程序那些事

响应式编程 reactor Reactive 程序那些事 响应式系统

训练营第三周作业

大脸猫

极客大学架构师训练营

全球首批搭载英特尔Xe MAX独显惊艳上市,非凡S3x尽显创作魅力

intel001

诈骗?通证项目方的危局

CECBC区块链专委会

区块链 法律

我去!三面字节竟全败在Redis上,带薪摸鱼刷1949页进阶笔记

996小迁

Java redis 架构 面试 程序人生

TensorFlow 2.4 Mac 优化版:性能大幅提升,可在最新的M1芯片上运行-InfoQ