QCon 演讲火热征集中,快来分享技术实践与洞见! 了解详情
写点什么

Model Server for Apache MXNet 引入 ONNX 支持和 Amazon CloudWatch 集成

  • 2019-10-30
  • 本文字数:1298 字

    阅读完需:约 4 分钟

Model Server for Apache MXNet 引入 ONNX 支持和 Amazon CloudWatch 集成

今天,AWS 发布了 Model Server for Apache MXNet (MMS) 版本 0.2,这是一个打包深度学习模型和为模型提供服务的开源库,适用于进行大规模预测。现在,您可以 Open Neural Network Exchange (ONNX) 的形式为模型提供服务,并直接向 Amazon CloudWatch (可在其中创建控制面板和警报) 发布运维指标。

什么是 MMS?

MMS 是一个开源库,旨在简化深度学习模型的部署以进行大规模推理。MMS 提供以下功能:


  • 提供可以将多个模型构件打包到单个模型存档中的工具。此存档封装了为模型提供服务所需的所有构件。

  • 能够使用模型存档中打包的自定义代码自定义推理执行管道中的每个步骤。

  • 提供预配置的服务堆栈,包括 REST API 终端节点和推理引擎。

  • 在为可扩展模型提供服务方面,提供了 Docker 镜像,包括 MMS、MXNet 和 nginx。

  • 提供实时运维指标,用于监控 MMS 和终端节点。


您可通过 PyPI (Python Package Index) 包预配置的 Docker 镜像安装 MMS,也可直接通过 Model Server GitHub 存储库安装 MMS。

ONNX 模型服务简介

ONNX 实现了深度学习框架之间的互操作性。借助 MMS 版本 0.2,您可使用 MMS 为通过支持 ONNX 的任何框架创建的 ONNX 模型提供服务。其中包括 PyTorch、Caffe2、Microsoft Cognitive Toolkit (CNTK) 和 Chainer。


要开始为 ONNX 模型提供服务,请参阅 MMS ONNX 服务文档

向 CloudWatch 发布模型服务指标

此版本包含与 CloudWatch 的集成,后者是一种适用于云资源和应用程序的监控服务。您可使用 CloudWatch 收集和跟踪指标、设置警报,并自动对变更做出反应。


MMS 现在直接与 CloudWatch API 集成,从而能够轻松向 CloudWatch 发布运维指标。能够近乎实时地监控运维指标对于任何生产服务都至关重要。


MMS 可报告各项模型服务指标,如请求计数、错误、延迟以及 CPU、内存和磁盘的主机资源使用率。借助 CloudWatch 集成,您可利用基于 Web 的控制面板、实时提供的指标,以及触发器和提醒配置功能。


要开始使用 MMS 与 CloudWatch 集成后提供的功能,请参阅 MMS CloudWatch 指标文档

了解更多信息并做出贡献

要了解关于 MMS 的更多信息,请先学习我们的 Single Shot Multi Object Detection (SSD) 教程,本教程将引导您完成导出 SSD 模型和为其提供服务的所有步骤。您可在存储库的模型园文档文件夹中找到更多示例和文档。


我们不会停止开发 MMS 的脚步,欢迎社区以提交问题、请求和贡献的形式积极参与。请访问 awslabs/mxnet-model-server,开始使用!


作者介绍:


Hagay Lupesko 是 AWS 深度学习的工程负责人。他专注于构建让开发人员和科学家能够创造智能应用程序的深度学习系统。在业余时间,他喜欢阅读、徒步旅行以及与家人共享天伦之乐。


**



Jonathan Esterhazy 是 AWS 深度学习的高级软件工程师。**他负责构建工具和系统,为大规模训练和部署深度学习系统提供更多便利。


**



Ruofei Yu 是 AWS 深度学习的软件工程师。**他专注于为软件工程师和科学家构建创新的深度学习工具。在业余时间,他喜欢与朋友和家人共度美好时光。


本文转载自 AWS 技术博客。


原文链接:


https://amazonaws-china.com/cn/blogs/china/model-server-for-apache-mxnet-introduces-onnx-support-and-amazon-cloudwatch-integration/


2019-10-30 08:00601

评论

发布
暂无评论
发现更多内容

DevOps与低代码:重塑软件开发与运维新时代

EquatorCoco

DevOps 运维 低代码

巴黎奥运会:在线观看赛事直播平台开发与数据获取方法

软件开发-梦幻运营部

从零开始:使用 Playwright 脚本录制实现自动化测试

霍格沃兹测试开发学社

知识付费的感想

玄兴梦影

OpenAI 或将推出多模态人工智能数字助理;研究发现部分 AI 系统已学会「说谎」丨 RTE 开发者日报 Vol.203

声网

低代码与AI技术发展:开启数字化新时代

不在线第一只蜗牛

人工智能 AI 低代码

Postgresql查询每个月最后一天的数据||查询每个月数据中的最后一条数据

李爽

postgresql #SQL

我,古希腊掌管「智算」的神!

白洞计划

AI 智算

探索未知:风靡硅谷开发者的 Unstructured Data Meetup 即将登陆中国

Zilliz

AI 非结构化数据 Meetup Zilliz

从XML配置角度理解Spring AOP

快乐非自愿限量之名

Java xml spring

【YashanDB知识库】ycm托管数据库时,数据库非OM安装无法托管

YashanDB

yashandb 崖山数据库 崖山DB

容器技术:优化软件测试流程的利器

霍格沃兹测试开发学社

精准记录:使用 Playwright 实现屏幕截图

霍格沃兹测试开发学社

俄罗斯方块游戏编程

芯动大师

编程 俄罗斯方块游戏 51单片机

虚拟仿真云实训平台:更优质的教育资源服务

3DCAT实时渲染

虚拟仿真 实时渲染 仿真云

有了1688跨境接口,没有1688代采系统怎么办?

tbapi

1688API接口 1688代采系统

探索车路云深度融合的优化与实践

观测云

人工智能

个人名片升级攻略:ChatGPT助您塑造独特简历风格

测试人

软件测试 简历 ChatGPT

特权账号管理的那些坑

芯盾时代

iam 统一身份认证 特权账号管理

为什么推荐将 IoTDB 服务地址配置为 HostName 而非 IP?

Apache IoTDB

浅谈设计模式

Ethan

Java 设计模式

Qualcomm CPU: IPQ9574, IPQ9554 and IPQ5322, what do you know?

wifi6-yiyi

WiFi7 ipq9574

字节面试:说说Java中的锁机制?

王磊

Java 面试

大厂技术同学的落地困境

老张

团队管理 职业规划 职场发展 大厂求职

国标参编征集 | 关于公开征集《物流企业数字化 第二部分:平台架构》国家标准起草单位的通知

信通院IOMM数字化转型团队

数字化转型 物流

免费的集成组件有哪些?

RestCloud

ETL 数据集成 ETLCloud

文档解析与向量化技术加速多模态大模型训练与应用

热爱编程的小白白

低代码与Web开发:颠覆传统模式的现代技术

快乐非自愿限量之名

前端 Web 低代码

解锁弹框:Python 下的 Playwright 弹框处理完全指南

霍格沃兹测试开发学社

9大原因分析贝莱德投资RWA赛道的ONDO 逻辑,内附

股市老人

Model Server for Apache MXNet 引入 ONNX 支持和 Amazon CloudWatch 集成_语言 & 开发_亚马逊云科技 (Amazon Web Services)_InfoQ精选文章