写点什么

核心产品全面 Serverless 化、开源 300 多个 AI 模型加速软件 AI 化,阿里云如何抓住技术“定义权”?

  • 2022-11-04
    北京
  • 本文字数:4241 字

    阅读完需:约 14 分钟

核心产品全面Serverless化、开源300多个AI模型加速软件AI化,阿里云如何抓住技术“定义权”?

“阿里云将坚持技术长征,抓住未来技术的定义权。”阿里云智能总裁张建锋在 2022 云栖大会上表示。


张建锋表示,随着新一轮的科技变革深入发展,一个全新的计算体系正在到来。过去十多年,云的创新主要集中在软件领域,首先出现了分布式虚拟化,而后实现了资源池化,形成了广泛的应用规模。现在,云计算已经从软件创新,走向软硬件协同创新,用云来定义整个 IT 硬件体系。


张建锋认为,云计算给软件研发范式带来的变革有三个层次:第一,新兴软件开发方式崛起,软件架构全面 Serverless 化;第二,软件开发不再是程序员的专利,低代码让未来 80% 应用能够由业务人员直接开发;第三,未来所有软件都是 AI 化的,大模型开源将加速 AI 真正普及。其中,Serverless 是软件研发范式变革中最重要的趋势之一。


在本届云栖大会上,阿里云向外界展示了自己最新的研发成果和技术趋势分析。继飞天为阿里云打下扎实技术基础后,自研 CPU 芯片倚天 710、下一代云计算体系架构 CIPU 等将为阿里云构建第二技术曲线,成为云面向下一代技术构建的核心竞争力。



“倚天 + 飞天 +CIPU”组合,提升 20% 以上性能


为进一步优化数据处理和传输效率,阿里云构建了以数据为中心的新型云计算架构体系,提供近网络计算和近存储计算的加速技术支撑。


飞天操作系统在 2013 年首次全球范围内突破单一集群 5000 台服务器规模(飞天 5K),并率先对外提供这一能力。此后,飞天操作系统成功支撑了十多年双 11 和 12306 春运购票等极限并发场景。


而在今年的大会上,阿里云发布了一款云数据中心专用处理器 CIPU,替代 CPU 来管理和加速计算、存储和网络资源。CIPU 是一种全新的架构方式,实现了全面专用硬件加速的高性能,包括高带宽、高吞吐和弹性 RDMA 的能力。


在飞天 +CIPU 加持下,Redis/Tair 数据库的缓存 QPS 性能可提升 80%,数据库的主从复制延迟降低 50%、全局一致性读性能提升 5~10 倍,大数据 Spark 性能提升 30%,AI 深度学习图形分类训练性能提升 30%,OLAP 实时数仓查询性能提升 2 倍以上,冷热分层四种存储类型,一份数据支持多种计算引擎……另外,阿里自研的 CPU 倚天 710 已经在数据中心大规模部署,并以云的形式服务阿里巴巴和多家互联网科技公司,算力性价比提升超 30%、单位算力功耗降低 60%,成为中国首个云上大规模应用的自研 CPU。据悉,在 2021 年双 11 期间,天猫双 11 核心交易系统平滑迁移至倚天 710 实例。未来 2 年,阿里云 20% 的新增算力将使用自研 CPU。


在这个体系下,“倚天 + 飞天 +CIPU”的组合表现也非常亮眼,在数据库、大数据和 AI 及高性能计算、视频编解码等场景下普遍优于业内同类产品,性能可提升 20% 以上。


据悉,搭载倚天芯片的阿里云弹性计算实例 G8M 将于 11 月 15 日正式上线,同时 CIPU 也被首次引入到专有云形态,为政企客户提供存算分离的“一云多芯、一云多 region”架构能力。



阿里云核心产品全面 Serverless 化


Serverless 让云计算从一种资源真正变成了一种能力。张建锋表示,过去云计算用云服务器替代了物理服务器,但客户依旧按“几核几 G 服务器”的模式来购买云资源,未来云计算将全面 Serverless 化,更加接近“电网”模式,按计算的调用次数付费。


这意味着软件开发方式将发生深刻变化,软件架构从原来的主机架构迁移到 Serverless 架构,客户只需要开发业务逻辑,不再需要关心运维问题。此外,Serverless 架构可以降低软件开发门槛,提供更多的预制模块,大幅提高软件生产效率。


目前,阿里云已经拥有超过 20 款 Serverless 产品,包括函数计算 FC、Serverless 应用引擎 SAE、Serverless 容器服务 ASK、PolarDB 数据库、AnalyticDB 数仓等。其中函数计算日调用次数超过 200 亿次,有效支撑历年双 11 百万 QPS 洪峰,业务年均增速超 300%,整体规模位居国内首位。


同时,相关产品也不同领域有广泛应用。比如,零售商超世纪联华将会员系统、交易系统等放在了阿里云函数计算上处理,告别了靠扩展机器支撑大体量业务,促销准备时间从周级缩短到小时级,成本下降 40%。南瓜电影在遇到大量用户涌入时,可在短时间内切换到阿里云 Serverless 应用引擎 SAE,峰值时秒级自动扩容,峰谷时按需自动缩容,总成本下降 40%。


“我们希望让用户做得更少而收获更多,通过 Serverless 化,用云就像用电一样简单。”张建锋表示,未来云将全面 Serverless 化,更加接近“电网”模式,按计算的调用次数付费。



阿里云 Serverless 布局


阿里云数据库 All in Serverless


在 2022 云栖大会上,阿里云还宣布 PolarDB、AnalyticDB(简称 ADB)、RDS、Lindorm 等核心数据库产品已与自研 CPU、CIPU、飞天操作系统进行深度融合创新,并全面 Serverless 化,对外更好地提供一站式数据管理与服务。测试数据如下:


  • RDS 数据库基于自研 CPU 的软硬协同优化,整体性价比提升 25%;

  • PolarDB 通过融合自研 Smart-SSD 智能固态硬盘技术,实现性能零损耗,数据存储成本最高下降 60%。


PolarDB 是业内首创支持跨机 Serverless 服务的云数据库,突破了无感秒切和高性能全局一致性两大技术难点,与按照峰值负载配置容量的成本相比,最多可节省 95% 的数据库成本。同时,PolarDB 数据库最新商业化的云原生 HTAP 功能,在列存索引 IMCI 技术加持之下,TPC-C、TPC-H 性能实现行业大幅领先。


以 PolarDB 和 ADB 为代表的阿里云核心数据库产品也在 HTAP、离在线一体化等前沿技术上发力,进一步提升数据库产品的易用性,并进一步提升性能。其中,ADB 提供离在线一体化数据处理分析能力,基于一份数据融合两种计算模型 (MPP+BSP) 同时支持离线处理和在线分析,解决因数据同步产生的数据一致性和时效性问题,资源成本降低 30% 以上。


据悉,面向未来,阿里云数据库将整体向“四化”方向发展:


  • 云原生化:资源解耦、Serverless 化;

  • 平台化:基于云构建数据平台能力、OpenAPI 标准化;

  • 一体化:处理分析一体化、离在线一体化、集中分布一体化、多模处理一体化;

  • 智能化:AI for DB 简化运维、In-DB ML 挖掘数据价值。


ODPS 可同时调度超 10 万台以上服务器规模


另外,为满足用户多元化数据计算需求,阿里云 ODPS 升级为一体化开放大数据平台。升级后的 ODPS 支持大规模批量计算、实时分析等服务,提供实时流式计算、机器学习等多种计算能力,可同时调度超 10 万台以上服务器规模进行并行计算。


ODPS 实现了存储、调度、元数据管理上的一体化架构融合,支撑智慧交通、生命科学、风险精算等各领域数据的高效处理,并通过 DataWorks 提供一致的数据开发和治理服务。


在刚刚公布的 TPC-H 30000GB 基准测试中,ODPS-Hologres 刷新世界纪录,分数超过 2786 万分,领先第二名 23%。ODPS-MaxCompute 则在 TPCx-BB 100TB 标准测试中,连续 6 年保持性能和性价比第一。


软件 AI 化,大模型开源推动 AI 普及

磐久超高性能网络,时延显著降低 90%


为了突破计算性能、内存资源对 AI 模型训练效率的限制,阿里云打造了一套“磐久超高性能网络”,采用自研的 Solar-RDMA 高速网络协议,使处理器可访问其他任意服务器的内存,非常适合深度学习模型内神经网络的交互形态,相比传统模式可降低长尾时延 90% 以上,最低可至 2 微秒。


基于这套超高性能网络技术及软硬一体化能力,今年 6 月阿里云推出了新一代智能计算产品——灵骏,可最小化所有非计算开销,实现 5 倍的通信性能提升,千卡并行计算效率高达 90%,大规模 AI 场景下性能可提升 2-5 倍。

开源 300 多个 AI 模型,推出 AI 模型社区魔搭


张建锋表示,开源是软件进步的核心推动力量,过去开源推动了软件架构的进步,未来开源还将推动 AI 应用的进步和普及。


为了降低 AI 的使用门槛,充分发挥 AI 的潜能,阿里达摩院联手中国科大、CCF 开源发展委员会、澜舟科技、智谱 AI、深势科技、鹏城实验室云计算研究所、哈工大讯飞联合实验室等多家科研机构共同推出 AI 模型社区“魔搭”ModelScope。


魔搭社区践行“模型即服务(Model as a Service)”的理念,在代码开源的基础上更进一步,将 AI 的代码变成模型,将模型变成服务。社区实现了零门槛 AI 模型体验,一行代码模型推理,十行代码模型调优。


达摩院等率先向社区贡献 300 多个经过验证的优质 AI 模型,超过三分之一为中文模型。利用这些基础模型,开发者只需针对具体场景再稍作调优,就能快速投入使用。

云和端加速融合

无影强化云网端一体安全


张建锋认为,云端加速融合,算力正在不断从终端转移上云,这让终端突破了物理限制,不仅手机、电脑、汽车、音箱会变成计算机,未来万物皆是计算机。


例如,Rokid 在推出的 AR 眼镜中接入阿里云无影架构,利用云上算力,用户打开仅有 85 克重量的眼镜就能在眼前的虚拟现实画面中,与人聊天、办公,并且还能做 3D 渲染、大数据编程等复杂工作。


在 PC 电脑端,未来阿里云继续将 RISC-V 芯片和无影架构结合,让创新终端具有更高性能、更低能耗,并实现全栈自研。目前,阿里巴巴已经成为全球 RISC-V 技术与生态发展的引领者,并且已经完成了和云操作系统的适配,迈出了端边云一体的重要一步。


无影近期在多个场景推出生产力解决方案,包括研发、分支机构、RPA、教育等,往往都属于数据敏感领域。在为终端研发厂商提供更好的云流协议之外,无影进一步集成了安全能力。


无论用户使用既有应用、桌面实例池还是进行其他调度,都能够在敏感数据检测、行为日志处理、高危操作拦截、安全态势感知、外接设备权限、网络与应用安全监控等多个方面,设定符合自己场景的权限与策略。

玄铁 C908 实现 RISC-V 架构高能效突破


另外,阿里云最新发布的玄铁 C908 处理器实现了 RISC-V 架构的高能效突破,较业界同性能处理器能效提升超 30%。


为进一步提升 AI 算力及能效,玄铁 C908 采用最新 RISC-V Vector 1.0 标准,并基于标准新增 DOT 指令,全面优化 AI 算子及算法库,仅典型神经网络计算的性能就提升 50% 以上。在国际权威 MLPerf Tiny V0.7 推理性能测试中,玄铁 C908 超越此前夺冠的玄铁 C906,在图像分类任务中性能再提升 3.5 倍。玄铁 C908 可应用于视觉 AI、智能交互、AR/VR、5G 等场景。

结束语


“科技是阿里巴巴从过去走到现在,并且更好走向未来的基石。”如阿里巴巴董事会主席兼首席执行官张勇在云栖大会上所说,阿里希望用计算为社会提供一种数字化的基础能力。


根据行业权威研究机构 Gartner 发布 2021 年全球云计算 IaaS 市场份额数据,阿里云排名全球第三,市场份额为 9.55%,连续六年实现份额增长;同时,阿里云排名亚太市场第一,市场份额为 25.53%。而面对未来云计算市场日益激烈的竞争,阿里云能否凭借找出的第二技术曲线稳固如今地位甚至更进一步,让我们拭目以待。


2022-11-04 14:274469

评论

发布
暂无评论
发现更多内容

HashData多集群共享统一存储架构

酷克数据HashData

Flink SQL CDC 实践以及一致性分析

Apache Flink

flink

HashData外部表的实现与应用

酷克数据HashData

音乐信息检索:理性解构音乐

阿里云视频云

阿里云 算法 音频

一周信创舆情观察(3.1~3.7)

统小信uos

2021年4款好用的音乐编曲软件推荐

奈奈的杂社

寻找被遗忘的勇气(十一)

Changing Lin

3月日更

如何用一个月的时间啃完英语词典?

wbliu85

我用一个小小的开放设计题,干掉了40%的面试候选人

架构精进之路

Web 安全 软件设计 3月日更

万字长文,肝了一下午的线程池详解!

一个优秀的废人

Java 多线程 线程池 线程池工作原理

最新蚂蚁五面、拼多多三面、字节四面(已入职拼多多),个人面经分享

Java架构之路

Java 程序员 架构 面试 编程语言

ZooKeeper 的选举机制,你了解多少?

架构 分布式

《精通比特币》学习笔记(第七章)

棉花糖

区块链 学习 3月日更

【2021 ECUG Con】聚势而来,与你相约花开时

小剑客

区块链 云计算 大数据 开源 Go 语言

终于学完国内算法第一人10年经验总结的数据结构与算法详解文档

Java架构之路

Java 程序员 架构 面试 编程语言

COPU助力北大研究生开源公选课丨开源PostgreSQL研发课程成功进入北京大学

PostgreSQLChina

数据库 postgresql 开源 开源社区

大作业

yoki

KubeNode:阿里巴巴云原生 容器基础设施运维实践

阿里巴巴云原生

阿里巴巴 容器 运维 云原生 k8s

江苏交通控股打造IT架构云转型下的智慧交通

酷克数据HashData

轻量级的接口自动化冒烟框架

小小娃爱吃甜食

自动化 测试 框架 自动化部署

数字经济时代,区块链能否担当产业数字化转型核心赋能者?

旺链科技

区块链数字经济 区块链发展

前端开发:VS Code编辑器新建Vue文件自定义模板的方法

三掌柜

vue.js 大前端 3月日更

快了何止300%?阿里巴巴Java优化:设计+程序+并行+JVM+工具

Java架构追梦

Java 阿里巴巴 架构 面试 性能优化

话说 类加载过程 第一篇

木子的昼夜

第六.产品经理的项目管理

让我思考一会儿

新的RBAC:基于资源的权限管理(Resource-Based Access Control)

龙归科技

资源 权限管理 rbac

外卖下单用例流程图

阿珍爱上阿强

git 教程 --git revert 命令

生之欢愉,时间同行

大作业

胡益

Elasticsearch Inverted Index

escray

elastic 28天写作 死磕Elasticsearch 60天通过Elastic认证考试 3月日更

2021年爆锤39K月薪Offer!阿里巴巴Java面试(知识点)整理

Java架构之路

Java 程序员 架构 面试 编程语言

核心产品全面Serverless化、开源300多个AI模型加速软件AI化,阿里云如何抓住技术“定义权”?_语言 & 开发_褚杏娟_InfoQ精选文章