6 月 13 日,阿里云智能总裁张建锋在峰会上发布了云基础设施处理器 CIPU,推动云计算从以 CPU 为中心的体系架构进入以“飞天操作系统+CIPU”为中心的体系架构。
张建锋表示,过去十多年,云计算技术经历了两个发展阶段:第一阶段是分布式和虚拟化技术替代了大型机、小型机,满足了当时企业业务扩展带来的算力弹性需求;第二阶段出现了资源池化技术,通过把计算和存储进行分离,而后规模化编排和调度,形成了超大规模的计算和存储资源池。
近年来,云上客户的需求发生了很大变化,数据密集型的计算越来越多,不断地提高了对云计算提供的低时延、高带宽的需求,这些需求很难通过传统体系结构去满足。上述虽然两个阶段的演进推动云计算发展,但都是通过软件定义的方法,基于传统的以 CPU 为中心的体系架构去做优化,已经触及瓶颈。
张建锋表示,云计算进入了一个新的发展阶段。“我们越来越接近于下一个时代。新一代的云计算要从数据中心的内部做体系化创新,从以往的以 CPU 为中心的体系架构,进入以 CIPU 为中心的体系架构。
根据官方介绍,CIPU 向下接入物理的计算、存储、网络资源,快速云化并进行硬件加速;向上接入飞天云操作系统,管控阿里云全球上百万台服务器,让算力虚拟化损耗降到 0,并通过规模化应用 RDMA 网络技术,让访问云端比访问本地硬盘更快。
“这是一个全新的架构体系,从最底层的数据中心核心部件到最上层云原生软件,建立了完整的自研技术体系。”张建锋说道,“阿里云做到了软硬件完美结合,形成了‘飞天+CIPU’支撑的云计算技术体系。”
过去 13 年,阿里云自研出飞天云操作系统,并构建出自研芯片、服务器、计算、存储、网络等软硬一体的新型计算体系架构。
飞天是阿里自研的云操作系统,将遍布全球的上百万台服务器连接成一台超级计算机,单集群可达 10 万台规模,千亿级文件数,EB 级别存储空间。在 2021 云峰会上,阿里云宣布,飞天操作系统正在全面兼容 X86、ARM、RISC-V 等多种芯片架构,实现“一云多芯”。
阿里云智能总裁张建锋表示,传统 IT 时代围绕芯片建立 IT 生态,但云计算从根本上改变了这一模式,云操作系统可以将服务器芯片、专用芯片等硬件封装成标准算力,无论底层芯片是 X86、ARM、RISC-V 还是硬件加速,给客户提供的都是标准的、高质量的云计算服务。
芯片方面,2021 年 9 月,阿里云在云栖大会上发布了首款通用芯片倚天 710。作为一款为云而生的芯片,倚天 710 针对云计算特点做了大量优化,性能超过业界标杆 20%,能效比提升 50%以上。
架构层面,倚天 710 采用 ARMv9 架构,多达 128 核,主频最高 3.2GHz,可同时兼顾性能和功耗。同时,集成了业界最领先的 DDR5、PCIE5.0 等技术,能有效提升芯片的传输速率,并且可适配云的不同应用场景。目前,倚天 710 已在阿里云数据中心内部规模化部署,并支撑了 2021 年双 11 等多个核心业务。
在服务器、操作系统方面,阿里云在去年 9 月发布了自研的磐久服务器和龙蜥操作系统。磐久服务器采用了最新型的模块化设计,可实现计算存储分离,包括了高性能计算系列、大容量存储系列、高性能存储系列等,拥有风冷、液冷等不同散热模式,服务器交付效率提升 50%。磐久系列采用软硬件融合方式实现性能提升,结合自研的 MOC、FIC、AliFPGA、神盾卡等,来满足云原生的创新开发对性能和稳定性的机制要求。
龙蜥定位于服务器端操作系统,支持 X86、ARM、龙芯(LoongArch)等多种芯片架构和计算场景,性能和稳定性经受住了历年双 11 的严苛考验,为云上典型场景带来 40%的综合性能提升,故障率降低 50%,兼容 CentOS 生态,支持一键迁移,并提供全栈国密能力。
在计算层,阿里云自主研发了神龙架构。神龙与 CIPU 结合可将虚拟化转移到专用硬件中进行加速,将物理机的高性能与虚拟机的灵活性融为一体,虚拟化损耗几乎为零,并支持随时扩容。
在存储层,阿里云自研的分布式存储系统盘古,是阿里云底层的统一存储架构。盘古采用了分布式系统的容错架构和柔性平台设计,具备弹性伸缩、自动负载均衡等能力,支持块存储、对象存储、表格存储、文件存储、离线大数据处理等多种存储模式。基于盘古系统,阿里云建起丰富的云存储产品,包括公共云存储到混合云存储,从数据迁移到云上丰富的数据管理服务,全球部署规模超 100EB。
在网络层,阿里云飞天云操作系统的核心技术平台洛神云网络已经推出了 3.0 新平台架构,支持中心云到本地云和边缘云一致性的云网络体验,通过全新的物联网云连接器和智能接入网关让万物都能上阿里云。
评论