QCon北京「鸿蒙专场」火热来袭!即刻报名,与创新同行~ 了解详情
写点什么

核心产品全面 Serverless 化、开源 300 多个 AI 模型加速软件 AI 化,阿里云如何抓住技术“定义权”?

  • 2022-11-04
    北京
  • 本文字数:4241 字

    阅读完需:约 14 分钟

核心产品全面Serverless化、开源300多个AI模型加速软件AI化,阿里云如何抓住技术“定义权”?

“阿里云将坚持技术长征,抓住未来技术的定义权。”阿里云智能总裁张建锋在 2022 云栖大会上表示。


张建锋表示,随着新一轮的科技变革深入发展,一个全新的计算体系正在到来。过去十多年,云的创新主要集中在软件领域,首先出现了分布式虚拟化,而后实现了资源池化,形成了广泛的应用规模。现在,云计算已经从软件创新,走向软硬件协同创新,用云来定义整个 IT 硬件体系。


张建锋认为,云计算给软件研发范式带来的变革有三个层次:第一,新兴软件开发方式崛起,软件架构全面 Serverless 化;第二,软件开发不再是程序员的专利,低代码让未来 80% 应用能够由业务人员直接开发;第三,未来所有软件都是 AI 化的,大模型开源将加速 AI 真正普及。其中,Serverless 是软件研发范式变革中最重要的趋势之一。


在本届云栖大会上,阿里云向外界展示了自己最新的研发成果和技术趋势分析。继飞天为阿里云打下扎实技术基础后,自研 CPU 芯片倚天 710、下一代云计算体系架构 CIPU 等将为阿里云构建第二技术曲线,成为云面向下一代技术构建的核心竞争力。



“倚天 + 飞天 +CIPU”组合,提升 20% 以上性能


为进一步优化数据处理和传输效率,阿里云构建了以数据为中心的新型云计算架构体系,提供近网络计算和近存储计算的加速技术支撑。


飞天操作系统在 2013 年首次全球范围内突破单一集群 5000 台服务器规模(飞天 5K),并率先对外提供这一能力。此后,飞天操作系统成功支撑了十多年双 11 和 12306 春运购票等极限并发场景。


而在今年的大会上,阿里云发布了一款云数据中心专用处理器 CIPU,替代 CPU 来管理和加速计算、存储和网络资源。CIPU 是一种全新的架构方式,实现了全面专用硬件加速的高性能,包括高带宽、高吞吐和弹性 RDMA 的能力。


在飞天 +CIPU 加持下,Redis/Tair 数据库的缓存 QPS 性能可提升 80%,数据库的主从复制延迟降低 50%、全局一致性读性能提升 5~10 倍,大数据 Spark 性能提升 30%,AI 深度学习图形分类训练性能提升 30%,OLAP 实时数仓查询性能提升 2 倍以上,冷热分层四种存储类型,一份数据支持多种计算引擎……另外,阿里自研的 CPU 倚天 710 已经在数据中心大规模部署,并以云的形式服务阿里巴巴和多家互联网科技公司,算力性价比提升超 30%、单位算力功耗降低 60%,成为中国首个云上大规模应用的自研 CPU。据悉,在 2021 年双 11 期间,天猫双 11 核心交易系统平滑迁移至倚天 710 实例。未来 2 年,阿里云 20% 的新增算力将使用自研 CPU。


在这个体系下,“倚天 + 飞天 +CIPU”的组合表现也非常亮眼,在数据库、大数据和 AI 及高性能计算、视频编解码等场景下普遍优于业内同类产品,性能可提升 20% 以上。


据悉,搭载倚天芯片的阿里云弹性计算实例 G8M 将于 11 月 15 日正式上线,同时 CIPU 也被首次引入到专有云形态,为政企客户提供存算分离的“一云多芯、一云多 region”架构能力。



阿里云核心产品全面 Serverless 化


Serverless 让云计算从一种资源真正变成了一种能力。张建锋表示,过去云计算用云服务器替代了物理服务器,但客户依旧按“几核几 G 服务器”的模式来购买云资源,未来云计算将全面 Serverless 化,更加接近“电网”模式,按计算的调用次数付费。


这意味着软件开发方式将发生深刻变化,软件架构从原来的主机架构迁移到 Serverless 架构,客户只需要开发业务逻辑,不再需要关心运维问题。此外,Serverless 架构可以降低软件开发门槛,提供更多的预制模块,大幅提高软件生产效率。


目前,阿里云已经拥有超过 20 款 Serverless 产品,包括函数计算 FC、Serverless 应用引擎 SAE、Serverless 容器服务 ASK、PolarDB 数据库、AnalyticDB 数仓等。其中函数计算日调用次数超过 200 亿次,有效支撑历年双 11 百万 QPS 洪峰,业务年均增速超 300%,整体规模位居国内首位。


同时,相关产品也不同领域有广泛应用。比如,零售商超世纪联华将会员系统、交易系统等放在了阿里云函数计算上处理,告别了靠扩展机器支撑大体量业务,促销准备时间从周级缩短到小时级,成本下降 40%。南瓜电影在遇到大量用户涌入时,可在短时间内切换到阿里云 Serverless 应用引擎 SAE,峰值时秒级自动扩容,峰谷时按需自动缩容,总成本下降 40%。


“我们希望让用户做得更少而收获更多,通过 Serverless 化,用云就像用电一样简单。”张建锋表示,未来云将全面 Serverless 化,更加接近“电网”模式,按计算的调用次数付费。



阿里云 Serverless 布局


阿里云数据库 All in Serverless


在 2022 云栖大会上,阿里云还宣布 PolarDB、AnalyticDB(简称 ADB)、RDS、Lindorm 等核心数据库产品已与自研 CPU、CIPU、飞天操作系统进行深度融合创新,并全面 Serverless 化,对外更好地提供一站式数据管理与服务。测试数据如下:


  • RDS 数据库基于自研 CPU 的软硬协同优化,整体性价比提升 25%;

  • PolarDB 通过融合自研 Smart-SSD 智能固态硬盘技术,实现性能零损耗,数据存储成本最高下降 60%。


PolarDB 是业内首创支持跨机 Serverless 服务的云数据库,突破了无感秒切和高性能全局一致性两大技术难点,与按照峰值负载配置容量的成本相比,最多可节省 95% 的数据库成本。同时,PolarDB 数据库最新商业化的云原生 HTAP 功能,在列存索引 IMCI 技术加持之下,TPC-C、TPC-H 性能实现行业大幅领先。


以 PolarDB 和 ADB 为代表的阿里云核心数据库产品也在 HTAP、离在线一体化等前沿技术上发力,进一步提升数据库产品的易用性,并进一步提升性能。其中,ADB 提供离在线一体化数据处理分析能力,基于一份数据融合两种计算模型 (MPP+BSP) 同时支持离线处理和在线分析,解决因数据同步产生的数据一致性和时效性问题,资源成本降低 30% 以上。


据悉,面向未来,阿里云数据库将整体向“四化”方向发展:


  • 云原生化:资源解耦、Serverless 化;

  • 平台化:基于云构建数据平台能力、OpenAPI 标准化;

  • 一体化:处理分析一体化、离在线一体化、集中分布一体化、多模处理一体化;

  • 智能化:AI for DB 简化运维、In-DB ML 挖掘数据价值。


ODPS 可同时调度超 10 万台以上服务器规模


另外,为满足用户多元化数据计算需求,阿里云 ODPS 升级为一体化开放大数据平台。升级后的 ODPS 支持大规模批量计算、实时分析等服务,提供实时流式计算、机器学习等多种计算能力,可同时调度超 10 万台以上服务器规模进行并行计算。


ODPS 实现了存储、调度、元数据管理上的一体化架构融合,支撑智慧交通、生命科学、风险精算等各领域数据的高效处理,并通过 DataWorks 提供一致的数据开发和治理服务。


在刚刚公布的 TPC-H 30000GB 基准测试中,ODPS-Hologres 刷新世界纪录,分数超过 2786 万分,领先第二名 23%。ODPS-MaxCompute 则在 TPCx-BB 100TB 标准测试中,连续 6 年保持性能和性价比第一。


软件 AI 化,大模型开源推动 AI 普及

磐久超高性能网络,时延显著降低 90%


为了突破计算性能、内存资源对 AI 模型训练效率的限制,阿里云打造了一套“磐久超高性能网络”,采用自研的 Solar-RDMA 高速网络协议,使处理器可访问其他任意服务器的内存,非常适合深度学习模型内神经网络的交互形态,相比传统模式可降低长尾时延 90% 以上,最低可至 2 微秒。


基于这套超高性能网络技术及软硬一体化能力,今年 6 月阿里云推出了新一代智能计算产品——灵骏,可最小化所有非计算开销,实现 5 倍的通信性能提升,千卡并行计算效率高达 90%,大规模 AI 场景下性能可提升 2-5 倍。

开源 300 多个 AI 模型,推出 AI 模型社区魔搭


张建锋表示,开源是软件进步的核心推动力量,过去开源推动了软件架构的进步,未来开源还将推动 AI 应用的进步和普及。


为了降低 AI 的使用门槛,充分发挥 AI 的潜能,阿里达摩院联手中国科大、CCF 开源发展委员会、澜舟科技、智谱 AI、深势科技、鹏城实验室云计算研究所、哈工大讯飞联合实验室等多家科研机构共同推出 AI 模型社区“魔搭”ModelScope。


魔搭社区践行“模型即服务(Model as a Service)”的理念,在代码开源的基础上更进一步,将 AI 的代码变成模型,将模型变成服务。社区实现了零门槛 AI 模型体验,一行代码模型推理,十行代码模型调优。


达摩院等率先向社区贡献 300 多个经过验证的优质 AI 模型,超过三分之一为中文模型。利用这些基础模型,开发者只需针对具体场景再稍作调优,就能快速投入使用。

云和端加速融合

无影强化云网端一体安全


张建锋认为,云端加速融合,算力正在不断从终端转移上云,这让终端突破了物理限制,不仅手机、电脑、汽车、音箱会变成计算机,未来万物皆是计算机。


例如,Rokid 在推出的 AR 眼镜中接入阿里云无影架构,利用云上算力,用户打开仅有 85 克重量的眼镜就能在眼前的虚拟现实画面中,与人聊天、办公,并且还能做 3D 渲染、大数据编程等复杂工作。


在 PC 电脑端,未来阿里云继续将 RISC-V 芯片和无影架构结合,让创新终端具有更高性能、更低能耗,并实现全栈自研。目前,阿里巴巴已经成为全球 RISC-V 技术与生态发展的引领者,并且已经完成了和云操作系统的适配,迈出了端边云一体的重要一步。


无影近期在多个场景推出生产力解决方案,包括研发、分支机构、RPA、教育等,往往都属于数据敏感领域。在为终端研发厂商提供更好的云流协议之外,无影进一步集成了安全能力。


无论用户使用既有应用、桌面实例池还是进行其他调度,都能够在敏感数据检测、行为日志处理、高危操作拦截、安全态势感知、外接设备权限、网络与应用安全监控等多个方面,设定符合自己场景的权限与策略。

玄铁 C908 实现 RISC-V 架构高能效突破


另外,阿里云最新发布的玄铁 C908 处理器实现了 RISC-V 架构的高能效突破,较业界同性能处理器能效提升超 30%。


为进一步提升 AI 算力及能效,玄铁 C908 采用最新 RISC-V Vector 1.0 标准,并基于标准新增 DOT 指令,全面优化 AI 算子及算法库,仅典型神经网络计算的性能就提升 50% 以上。在国际权威 MLPerf Tiny V0.7 推理性能测试中,玄铁 C908 超越此前夺冠的玄铁 C906,在图像分类任务中性能再提升 3.5 倍。玄铁 C908 可应用于视觉 AI、智能交互、AR/VR、5G 等场景。

结束语


“科技是阿里巴巴从过去走到现在,并且更好走向未来的基石。”如阿里巴巴董事会主席兼首席执行官张勇在云栖大会上所说,阿里希望用计算为社会提供一种数字化的基础能力。


根据行业权威研究机构 Gartner 发布 2021 年全球云计算 IaaS 市场份额数据,阿里云排名全球第三,市场份额为 9.55%,连续六年实现份额增长;同时,阿里云排名亚太市场第一,市场份额为 25.53%。而面对未来云计算市场日益激烈的竞争,阿里云能否凭借找出的第二技术曲线稳固如今地位甚至更进一步,让我们拭目以待。


2022-11-04 14:274780

评论

发布
暂无评论
发现更多内容

马士兵强推面试前必刷:Alibaba内部Java高级架构师380道面试题

Java架构追梦

Java 阿里巴巴 面试 java架构

从五大结构体,带你掌握鸿蒙轻内核动态内存Dynamic Memory

华为云开发者联盟

鸿蒙 内存管理 结构体 动态内存 Dynamic Memory

企业想要升级生产管理系统,有哪些好用的低代码平台推荐?

优秀

低代码

一觉醒来,发现自建的数据库被勒索了,好可怕…

华为云数据库小助手

数据库 高可用 安全性 DAS

“区块链指导意见”重磅发布 场景化应用昭示新蓝海

旺链科技

区块链应用 区块链供应链金融落地

用node写个简单的脚手架!

Node cli

fish_redux使用详解---看完就会用!

小呆呆666

flutter ios android 大前端 社区

windows11泄露版尝鲜体验新功能!!!

学神来啦

win10 win11 windows10 windows 11

最强大的内在激励:自我承诺

石云升

激励 职场经验 管理经验 6月日更

数据校检

若尘

计算机组成原理 6月日更

Flutter&Dart Callback转同步

小呆呆666

flutter ios android 大前端

一周信创舆情观察(6.14~6.20)

统小信uos

Flutter Webview添加Cookie的正确姿势

小呆呆666

flutter ios android 大前端

空手撸SOLID架构设计原则,六大原则层层解析,你绝想不到

Java MySQL 程序员

与其摸鱼,不如来看:高性能消息中间件NSQ解析的整体介绍

不愧是Alibaba技术官,Kafka的精髓全写这本“限量笔记”里,服了

Java 架构 面试 分布式

CloudQuery 使用教程之《No.1 基础入门》

BinTools图尔兹

数据库 程序员 dba 国产数据库 运维开发

4个改变你编程技能的小技巧,建议细读

欢喜学安卓

android 程序员 面试 移动开发

4面字节跳动拿到Offer,灵魂拷问

欢喜学安卓

android 程序员 面试 移动开发

高性能计算对生命科学研究有何帮助?

北鲲云

云计算 高性能计算 生命科学 虚拟筛选

Rust从0到1-自动化测试-如何编写测试

rust 自动化测试 如何编写测试 Automated Tests

腾讯同事内推的那位Linux C/C++后端开发同学面试没过......

Linux服务器开发

Linux C/C++ Linux服务器开发 Linux后台开发 Linux网络编程

EBean ORM 框架介绍-3.实体草稿功能

Barry的异想世界

jpa ORM Ebean

限量!Alibaba首发“Java成长笔记”,差距不止一点点

Java 编程 程序员 架构 面试

nodejs学习记录

Node

网络攻防学习笔记 Day54

穿过生命散发芬芳

网络攻防 6月日更

Quick BI的可视分析之路

瓴羊企业智能服务

阿里云 数据中台 数据分析 数据可视化 商业分析

仿imtoken钱包源码开发,imtoken去中心化钱包开发

为什么vacuum后表还是继续膨胀?

华为云开发者联盟

索引 GaussDB 元组 VACUUM 行存表

自定义 View 功能上线,你的小程序可以更多变

蚂蚁集团移动开发平台 mPaaS

小程序 mPaaS 自定义控件

Python接口自动化之常见用例读取方法介绍

行者AI

测试 #python

核心产品全面Serverless化、开源300多个AI模型加速软件AI化,阿里云如何抓住技术“定义权”?_语言 & 开发_褚杏娟_InfoQ精选文章