写点什么

微软开源 ONNX Runtime 模型以加速 Google BERT

  • 2020-01-22
  • 本文字数:979 字

    阅读完需:约 3 分钟

微软开源ONNX Runtime模型以加速Google BERT

微软人工智能研究院 1 月 21 日称计划开源 BERT 自然语言模型优化版本,该模型可以与 ONNX Runtime 推理引擎配合使用。在为 Bing 搜索引擎提供语言表达功能时,Microsoft 使用相同的模型来降低 BERT 的延迟。该模型“为 Bing 用户带来了最佳搜索体验” ,去年秋天发表的一篇论文中对该模型进行了详细介绍。



论文地址:https://azure.microsoft.com/en-us/blog/bing-delivers-its-largest-improvement-in-search-experience-using-azure-gpus/


公司发言人表示,这意味着开发人员可以使用 ONNX Runtime 和 Nvidia V100 GPU 大规模部署 BERT,而延迟只有 1.7 毫秒,这样的性能表现过去只能在大型科技公司中实现。


2017 年,微软与 Facebook 合作创建了 ONNX,以推动跨 AI 硬件(如半导体)和软件(如机器学习框架)之间的互操作性。BERT 优化工具增加了许多 ONNX Runtime 加速器,例如 Nvidia TensorRT 和英特尔 OpenVINO。使用 ONNX 标准意味着优化后的模型可以与 PyTorch,TensorFlow 和其他流行的机器学习模型一起运行,这种改善是得益于 Azure AI 与微软 AI 研究院的合作。


“由于 BERT 模型主要由堆叠 Transformer 单元组成,因此我们通过将多个基本运算符的关键子图融合到 CPU 和 GPU 的单个内核(包括自注意力层、LayerNormalization 和 Gelu 层)中来优化每个单元。微软高级项目经理 Emma Ning 在博客中称:“这大大减少了许多基本计算之间的内存复制。”



对于微软来说,这是其在自然语言领域取得的最新突破,但这并不是业界第一次尝试优化 BERT。大约一年前,Microsoft AI 研究人员还发布了 MT-DNN,一款基于 Transformer 提升 GLUE 语言模型性能基准的模型。


一位业内人士称,通过使用像 BERT 和 MT-DNN 等基于 Transformer 的模型,使自然语言模型在文本生成等任务中表现更优越,是 2019 年 AI 取得的最大成就之一。



微软在其他自然语言开发上也取得了一定进展。在 2019 年温哥华 NeurIPS 上,微软和浙江大学联合发布了语音合成系统 FastSpeech,与自回归的 Transformer TTS 相比,FastSpeech 将梅尔谱的生成速度提高了近 270 倍,将端到端语音合成速度提高了 38 倍,单 GPU 上的语音合成速度达到了实时语音速度的 30 倍。 在 2019 年夏季,微软还推出了会话 AI 助手工具包 Icecaps。


原文链接:


https://venturebeat.com/2020/01/21/microsoft-open-sources-onnx-runtime-model-to-speed-up-googles-bert/


2020-01-22 13:355301

评论

发布
暂无评论
发现更多内容

鸿蒙跨端实践-布局方案介绍

京东科技开发者

集成Sermant,ServiceStage带你实现应用上下线平滑过渡

华为云开发者联盟

#人工智能

VMware vCenter Server 8.0U3b 发布下载,新增功能概览

sysin

vSphere vcenter esxi

一文轻松掌握Kotlin接口与类

Silently9527

Java kotlin

VMware vSphere 8.0 Update 3b 发布下载,新增功能概览

sysin

vSphere vmware vcenter esxi

橙篇与中传经管学院达成战略合作,联合推出经济学领域首个高校智能体「中传经小济」

Geek_2d6073

OpenAI以1500亿美元公司估值向投资者筹集65亿美元!安卓版谷歌Gemini Live免费上线|AI日报

可信AI进展

Paper Digest|OpenSPG 超大规模知识仓储 KGFabric 论文解读

可信AI进展

OpenSPG

边缘人工智能平台标准即将形成征求意见稿

中国信通院AI Infra工作组

淘宝API接口:关键词搜索商品列表数据接口

tbapi

淘宝API接口 淘宝商品列表数据接口

从YouTube到B站,Downie 4一网打尽,视频下载无界限!

Rose

服装企业必备增长利器:高效商品管理系统

第七在线

聚道云软件连接器9月新增应用合集(1)

聚道云软件连接器

功能更新

混沌工程入门指南

FunTester

6月25日相聚金陵,AIIA将召开多场线下组会

中国信通院AI Infra工作组

全面掌握 Jest:从零开始的测试指南(上篇)

EquatorCoco

Java 前端 Jest

任务管理软件Things3 for Mac

Mac相关知识分享

苹果虚拟机软件Parallels Desktop与VMware Fusion有何不同?

Rose

火热报名中 | 2024开放原子开源生态大会:聚焦产业发展,共谋生态繁荣之路

Geek_2d6073

开源即时通讯IM框架MobileIMSDK的H5端技术概览

JackJiang

即时通讯;IM;网络编程

VMware ESXi 8.0U3b 发布下载,新增功能概览

sysin

vSphere vmware esxi

苹果电脑免费好用的鼠标增强工具:Mos for Mac

Rose

Emby for Mac:一款强大的多媒体影音库管理工具

Rose

安装AutoCAD最新版,提示安装错误112解决方法

Rose

macOS Big Sur 11(苹果电脑mac11系统安装包)v11.7.10正式版

Rose

IPQ5018 vs IPQ5028: A comparative analysis of the most cost-effective WiFi6 solution chips

wifi6-yiyi

wifi6 ipq5018

超实用的办公模板合集(office模板、商业模板、思维导图模板)

Rose

免弹窗、预授权,默认界面扫码能力打造系统级扫码体验

HarmonyOS SDK

HarmonyOS

京东广告投放平台整洁架构演进之路

京东科技开发者

苹果电脑系统设置和维护工具TinkerTool System 9 for mac

Mac相关知识分享

Cocktail for Mac(系统清理)(15以上系统适用)v18.1 注册激活版

Rose

微软开源ONNX Runtime模型以加速Google BERT_文化 & 方法_KHARI JOHNSON_InfoQ精选文章