写点什么

英特尔发布 nGraph 编译器堆栈 Beta 版本,性能可提升 45 倍

  • 2018-12-04
  • 本文字数:1236 字

    阅读完需:约 4 分钟

英特尔发布nGraph编译器堆栈Beta版本,性能可提升45倍

深度学习计算性能对于科学家和工程师来说至关重要,他们需要利用深度学习技术来应对医疗、上午、自动驾驶等诸多领域的挑战。这也是英特尔今年 3 月份将 nGraph 库和编译器的早期版本在 GitHub 上开源的原因。 我们很早就清楚地看到,开放标准和互操作性的横向协作对于帮助科学家和工程师在各自领域实现下一波突破至关重要。英特尔内部的很多研究人员已经开始使用 nGraph 探索更前沿的 AI 话题,比如使用同态加密使基于私有数据的推理成为可能。


我们将在今天正式发布:nGraph编译器堆栈的Beta版本。这一版本侧重于加速英特尔®至强®可扩展处理器上的深度学习推理工作负载,并具有以下主要特性:


  • 为 TensorFlow、MXNet 和 ONNX 提供开箱即用的安装体验。

  • 对 TensorFlow 中可用的 20 个常见工作负载、MXNet 中的 18 个常见工作负载、ONNX 中的 14 个常见工作负载做了优化并对优化效果做了验证。

  • 支持Ubuntu 16.04(TensorFlow、MXNet 和 ONNX)和 MacOS X 13.x 版本(支持 TensorFlow 和 MXNet 构建)。


这一版本对已经在生产环境中广泛部署的一些常见工作负载均做了优化。这些工作负载涵盖了各种类型的深度学习,包括:


  • 图像识别和分割

  • 物体检测

  • 语言翻译

  • 语音生成和识别

  • 推荐系统

  • 对抗生成网络(GAN)

  • 强化学习


图1 使用nGraph对MXNet推理性能的提升效果


图 1 使用 nGraph 对 MXNet 推理性能的提升效果


在我们的测试中,优化后的工作负载最多可以比原生框架快 45 倍,并且我们期望通过下面描述的强大的模式匹配功能来提升其他工作负载的性能。


传统上,为了从硬件中获得更高的深度学习性能,用户必须等待硬件制造商创建并更新内核库,这些内核库能在“立即模式”执行接口中公开(有时需要手动调整)各个操作。虽然这些内核优化通常会带来惊人的性能提升,但它们往往是基于特定硬件的,这就预先消除了在非特定设备上优化的任何机会。通过匹配非特定设备和特定设备的优化,我们可以解锁更多性能提升的可能,这就是我们构建 nGraph 编译器的原因。



在我们发布的 Beta 版本中有许多关键特性:nGraph 是第一个同时支持训练和推理支持多个框架的图形编译器;它允许开发人员将同一概念模型或算法设计自由地用在不同硬件后端。 这些特性中的任何一个可能都已经足够好;综合起来,这些特性使开发人员确信他们的神经网络(NN)设计不仅可以不断扩展,而且还能适应各种变化因素。未来,适应性将变得越来越重要,对于开发人员来说,要提前猜到后续可能需要大量或复杂优化的机器学习问题的界限将越来越困难。


在我们计划于 2019 年 Q2 初发布的 Gold 版本中,我们将进一步扩大更多框架上工作负载的覆盖范围,包括对量化图和 Int8 格式的额外支持。我们设计 nGraph 编译器以支持不断增加的 AI 硬件列表,因此英特尔®Nervana™神经网络处理器和其他加速器的早期采用者将能够在整个 2019 年使用 nGraph 编译器进行测试。更多详细信息,请参阅我们的生态系统文档。我们建议你查阅我们的快速入门指南或下载最新版本的 nGraph,如果有任何反馈或评论,欢迎你在GitHub上告诉我们。


阅读英文原文:nGraph Compiler Stack–Beta Release



2018-12-04 13:451165
用户头像
蔡芳芳 InfoQ主编

发布了 802 篇内容, 共 570.1 次阅读, 收获喜欢 2796 次。

关注

评论 1 条评论

发布
暂无评论
发现更多内容

联邦推荐系统——个性化推荐与隐私安全的兼顾者

星云Clustar

联邦学习 推荐系统 数据隐私 数据安全 隐私计算

拓客宝APP系统模式开发定制

获客I3O6O643Z97

软件库与框架的区别

码语者

架构 框架

星客电商系统开发(介绍)

開發15347427695

剧本杀是不是个好生意?

石云升

商业洞察 商业分析 7月日更

小解c# foreach原理

喵叔

7月日更

【涨知识】你不知道的Python常用开发工具!猿来这么多!

小阿杰

Python 后端 开发工具

勇于尝试新鲜事物,利于项目来积累学习经验

吴脑的键客

职业规划

什么是容器安全

greatersecurity

云原生 DevSecOps

企业微信的IM架构设计揭秘:消息模型、万人群、已读回执、消息撤回等

JackJiang

微信 架构设计 即时通讯 IM 群聊

如何保证 Serverless 业务部署更新的一致性?

Serverless Devs

云计算 Serverless 云原生

CTF中的一些常见骚操作(可以没有,但不能不会)

网络安全学海

网络安全 信息安全 CTF 渗透测试 漏洞分析

XCH挖矿系统开发案例搭建

開發15347427695

网络攻防学习笔记 Day79

穿过生命散发芬芳

网络攻防 7月日更

5分钟速读之Rust权威指南(四十三)宏

wzx

rust

在腾讯,我的试用期总结

程序员鱼皮

Java c++ Python 大前端 后端

服装企业生产管理问题重重,低代码能否在其中发挥神效?

优秀

低代码

前方高能预警!阿里大佬出品“Spring实战学习笔记”震撼来袭

白亦杨

Java 编程 程序员

量化合约交易现成系统源码

開發15347427695

平安Java岗面试耗尽了我毕生所学,想了想,还是去阿里吧

Java 程序员 架构 面试

U盘中病毒了,丢失的文件能用EasyRecovery恢复吗?

淋雨

EasyRecovery 文件恢复 硬盘数据恢复

大数据训练营-0711课后作业

cc

免费分享Mysql从入门到精通的优秀图书

Java入门到架构

DeFi智能合约挖矿模式开发系统

開發15347427695

高并发服务优化篇:详解RPC的一次调用过程

Coder的技术之路

RPC RPC调用

聚焦Real Time DaaS 赛道,Tapdata 获数千万美元 Pre-A 轮融资

tapdata

实时数据服务平台 Real Time DaaS

[架构实战营]模块二作业

xyu

#架构实战营

想在Java八股文面试中脱颖而出?这《1000道互联网大厂Java工程师面试题》必不可少!

Java 编程 程序员

程序员上班“划水”向阿里猛投简历,两次被刷后,终成“菜鸟”P6

Java 程序员 架构 计算机

乐视界挖矿模式系统开发

開發15347427695

区块链量化交易所开发|搭建量化交易系统

Geek_23f0c3

交易所开发 量化交易系统 区块链、

英特尔发布nGraph编译器堆栈Beta版本,性能可提升45倍_硬件_Harry Kim_InfoQ精选文章