写点什么

云上企业如何加速创新?亚马逊云科技发布数智融合新趋势

  • 2022-05-12
  • 本文字数:2641 字

    阅读完需:约 9 分钟

云上企业如何加速创新?亚马逊云科技发布数智融合新趋势

日前,以“云领数智融合,重塑创新引领”为主题的亚马逊云科技大数据与机器学习媒体沟通会在北京举行。亚马逊云科技大中华区产品部总经理陈晓建、亚马逊云科技大中华区产品部技术专家团队总监王晓野、亚马逊云科技大中华区产品部机器学习产品高级经理张洋接受了 InfoQ 在内的少数几家媒体采访。

 

随着信息技术日益发展,近几年,全球数据量激增。统计显示,2020 年,全球数据量达到了 60ZB,其中中国数据量增速迅猛。预计 2025 年中国数据量将增至 48.6ZB,占全球数据量的 27.8%。

 

毋庸置疑,数据早已成为企业最重要的资产,但数据价值却未得到充分利用。福布斯调研报告数据显示,如果能够成为一个数据驱动型公司,那么公司收入会增加 20%,成本会减少 30%。

 

亚马逊云科技认为,企业要想重塑数据洞察,一定要做到数智融合,将数据(大数据技术)和智能(机器学习技术)进行融合和统一。从而更加高效地围绕数据构建和实施项目,使得数据在两者之间无缝流转,成员快速具备相关能力,推动公司企业数字化转型迈向新的高度。

当大数据遇上机器学习

 

IT 时代产生的数据呈指数级增长,而数据也被应用到了更多的领域中。与过去相比,数据的规模日益庞大,应用场景日益复杂,这些都给大数据计算提出了更高的挑战。而企业对大数据服务也提出了更高的要求。越来越多的企业希望拥有按小时,甚至按分钟级实时的大数据服务。

 

与此同时,随着 AI 技术不断发展,AI 技术的应用深度和广度也在不断加深。根据 IDC 报告显示,到 2023 年,AI 系统支出将达到 979 亿美元(约合 6557 亿元人民币),比 2019 年增加 2.5 倍。另外根据 Gartner 的分析,到 2024 年,75% 的企业将把机器学习技术真正用于生产,为业务所赋能。

 

“从这两点来看,大数据和机器学习技术会对企业业务产生越来越大的作用,越来越多的企业希望能够通过融合大数据和机器学习能力来提供业务产出,以充分发挥数据的价值。”陈晓建说道。

 

可以看到的企业需求趋势是,在组织架构层面,企业将原来分散在各个部门的机器学习实践进行整合,并与大数据项目进行统一协调和资源配置;在人员能力层面,企业要求和安排原有传统的大数据实践者掌握机器学习技术,应用到大数据具体项目或承接新的机器学习相关的项目需求,要求机器学习从业者也要掌握大数据处理能力,更好、更便捷地完成模型所需的数据准备和加工;在项目实施层面,仅依靠传统的大数据技术是无法全方位提供充足的数据见解,仍需要机器学习的模型能力补充,越来越多的数据项目会融合大数据和机器学习两者的能力;在工具支撑层面,企业需要面向大数据技术和机器学习构建统一的开发平台和技术基础,可能是对已有大数据平台进行改造增加机器学习相关场景和能力,或是完全推倒重新构建一个面向两者的通用的平台。

 

陈晓建认为,数智融合需要解决三个问题:

 

第一,数据和机器学习分而治之,数据及技术孤岛制约敏捷迭代。数据的丰富性、准确性和质量,直接决定了机器学习最终的效果。但企业通常分开独立建设大数据能力和机器学习能力,多个部门数据孤岛式呈现。

 

第二,数据处理能力不足。在生产制造企业,机器学习帮助客户对产品售后维修需求进行预测,由被动响应变为主动规划。但由于不具备足够的大数据处理能力,模型开发成功后 ,不能够有效收集处理海量的运营数据,致使预测不准确,无法达到预期业务目标。

 

第三,数据分析人员参与度低。现实情况经常是,模型在实验环节效果良好,但实际使用中却不尽人意,实验环境只是对真实环境的简单模拟,生产环境要复杂得多。

实现数智融合需要构建三大核心能力

 

“企业在云中要打造统一的数据基础底座,实现大数据和机器学习的’双剑合璧’,为企业发展提供创新引擎。这是我认为实现数智融合最有效的一条途径。”

 

陈晓建表示,实现数智有效融合的途径一是建立统一融合的治理底座,如数据质量、数据权限、数据开发、数据工作流、可视化;二是要让大数据和机器学习之间高效充分的双向互动,互为支撑,互为因果,形成正向循环。

 

而企业要想实现数智融合需要构建三大核心能力:

 

  • 统一数据共享。让数据资产化,打破数据孤岛。

  • 统一权限管控。因为只有具备完善的权限控制能力,放心的让数据在不同的业务系统之间流转。

  • 统一开发及流程编排。融合端到端的大数据和机器学习任务,提升整体的开发效率。

 

亚马逊云科技的经验之一就是构建云中统一的数据治理底座,打破数据及技能孤岛。企业需要构建统一的数据治理底座,实现大数据和机器学习的数据共享,数据权限的统一管控,以及两者统一的开发和流程编排。云中统一的数据治理底座不仅能提升大数据和机器学习的高效融合,还能减少大数据和机器学习重复构建的工作,并且显著降低成本。

 

“在 2021 re:Invent 期间,我们的 Amazon SageMaker Studio 进行了能力升级,通过 Amazon SageMaker Studio 统一的开发界面,现在可以实现数据科学家或是数据工程师用统一的界面实现机器学习、算法模型开发之外的能力,还可以通过 Amazon Athena 访 问不同数据源的数据,也可以通过 Amazon EMR 实现大数据处理,也可以通过同样的界面,通过代码调用 Amazon Redshift,访问数据仓库里的数据。”王晓野说道。

 

此外,还需要助力机器学习由实验转为实践,为机器学习提供生产级别的数据处理能力。机器学习项目成功的关键,就是对复杂的数据进行加工和准备。

 

最后,让数据分析智能化,赋能业务人员探索创新。比较常见的方式是通过一些工具降低探索机器学习建模难度,比如亚马逊深度集成机器学习 Amazon SageMaker 模型预测能力的 Amazon QuickSight 、在分析结果中添加基于模型预测的 Amazon Athena ML,都可以帮助开发者使用熟悉的技术,甚至通过自然语言来使用机器学习。

 

“大数据技术与机器学习技术,其实有着非常不同的发展路径。但是有一部分的企业已经走在了数据驱动转型的前沿,借助云计算实现了它们二者有机的融合。”王晓野说道。

人工智能将无处不在

 

人工智能从出现到发展至今不过十年。不过根据 IDC 2022 年中国人工智能及自动化市场的十大预测,人工智能将无处不在。

 

IDC 中国助理研究总监卢言霞表示,到 2022 年,60% 的中国 1000 强公司将在所有关键业务的横向职能中扩大使用 AI/ML,如营销、法务、人力资源、采购和供应链、物流等。由于机器学习更加依赖算力、算法、数据,人工智能的快速发展拉动了对 AI 基础数据服务的需求,预计在未来几年内将稳步增长。

 

而随着 AI 技术进一步发展,大数据与 AI 结合的优势也将进一步显现。可以预见的是,云上企业要想加速创新,或将必然加入这场数智融合之旅中。

2022-05-12 11:022076

评论

发布
暂无评论
发现更多内容

使用 kubectl-rabbitmq 部署和运维 K8S 上的 RabbitMQ 集群

郭旭东

RabbitMQ kubectl kubectl plugin

在GitHub中向开源项目提交PR的过程

worry

GitHub pull request

JavaScript02 - js的引入方式

Mr.Cactus

JavaScript

Python列表对象入门

赵开忠

28天写作

Spring Boot 集成Thymeleaf模板引擎

武哥聊编程

Java springboot SpringBoot 2 thymeleaf 28天写作

电商网站商品管理(二)多种搜索方式

escray

elasticsearch elastic 28天写作 死磕Elasticsearch 60天通过Elastic认证考试

APICloud AVM多端开发 |《生鲜电商app开发》项目源码教程

YonBuilder低代码开发平台

大前端 移动开发 APP开发 APICloud

技术创新是PC市场发展基石,英特尔占据明显领先优势

E科讯

案例研究之聊聊 QLExpress 源码 (七)

小诚信驿站

聊聊架构 规则引擎 28天写作 QLExpress源码 聊聊源码

JavaScript04 - JavaScript语法

Mr.Cactus

JavaScript

2021字节、华为、滴滴Java内部面试题(含答案),新鲜出炉!

比伯

Java 编程 架构 面试 程序人生

超越身边80%的人,其实没有你想象的那么难

架构精进之路

认知提升 成长笔记 七日更 28天写作

区块链2021狂想曲:迎接以技术为名的春天

脑极体

也谈Python编码格式

ITCamel

Python 编码格式

9. 细节见真章,Formatter注册中心的设计很讨巧

YourBatman

Converter ConversionService Formatter

为什么印度不会成为世界工厂?

JiangX

印度 28天写作 世界工厂

详解HDFS3.x新特性-纠删码

五分钟学大数据

hadoop hdfs

自动驾驶分级,小白能理解的那种(28天写作 Day8/28)

mtfelix

自动驾驶 28天写作

我们为什么打比方

石云升

28天写作 确认偏误 打比方

Java并发编程实战(4)- 死锁

技术修行者

Java 并发编程 多线程 死锁

JavaScript01 - 基础

Mr.Cactus

JavaScript

JavaScript05 - JavaScript数据类型

Mr.Cactus

JavaScript

保姆级 tomcat 快速入门

田维常

tomcat源码解读

一文带你学会AQS和并发工具类的关系

比伯

Java 编程 架构 面试 计算机

一文带你学会AQS和并发工具类的关系

伯阳

AQS java 并发 ReentrantLock 多线程高并发 lock锁

【得物技术】代码覆盖率原理与得物app实践

得物技术

测试 原理 代码 得物技术 覆盖率

限时开放!阿里P8大师终于把这份微服务架构与实践第2版PDF分享出来了

Java 编程 程序员 微服务 架构师

JavaScript03 - window对象的方法

Mr.Cactus

JavaScript

[5/28]产品运维保障体系的质量实践

L3C老司机

使用nodejs和express搭建http web服务

程序那些事

HTTP nodejs 异步IO 程序那些事 web服务

IO和NIO的对比篇

Java架构师迁哥

云上企业如何加速创新?亚马逊云科技发布数智融合新趋势_AI&大模型_凌敏_InfoQ精选文章