华为云瑶光(Alkaid)作为面向云、AI、5G 时代的分布式云操作系统,承载未来“分布式、确定性、多维智慧”的云,致力于打造“极优、极简”的云上体验。
根据 Frost&Sullivan 对于中国公有云市场的调查研究结果显示,2019 年 Q4 华为云 IaaS 市场份额位列第三,在 Top 厂商中继续保持稳健增速。伴随华为云持续的规模扩展及服务种类创新,必须通过底层全链路的数字化,才能进一步优化经营水平实现降本增效。
当前,华为云面临多维经营挑战:
1)规模大:华为云布局全球多个地理区域和可用区,提供高速稳定的全球云联接网络、贴近客户的本地化服务;
2)资产多:华为云的资产种类和数量多,包含模块化数据中心、海量服务器设备、复杂组网及线路等;
3)产品种类丰富:华为云面向用户提供 200+云服务、190+解决方案、3500+云市场商品等;
4)用户业务复杂:承载 300 万+企业用户与开发者多样应用,涵盖 AI 应用、AR/VR、云游戏、云手机等;
5)经营流程复杂:包含从数据中心、机房机柜等基础设施建设,到服务器生成、物流发货、上架部署等资源池建设,再到虚拟化、大规模分布式调度、资源池动态优化、产品和服务多样化以及弹性供给等调度和服务能力。
华为云瑶光基于现网资产经营、客户支撑、产品研发上线等经营活动,构建了智能分析与规划平台,并基于此催化出新的经营和产品能力。
瑶光智能分析与规划平台包含如下核心子系统:数据采集和对接子系统、数据存储和服务子系统、数据分析和建模子系统、资源池经营子系统、业务创新子系统。接下来将依次展开介绍。
数据采集和对接子系统
子系统向下对接华为云全球的基础设施,对海量资产的监控数据进行实时采集和动态分析优化;对复杂的流程(例如规划、建设、运营、运维等)进行信息化和数字化;对产品和服务的管控面数据进行对接,获取服务能力和质量。
为保证数据的全面性、准确性、多样性,数据采集子系统提供如下主要能力:
分布式数据采集和对接:数据分布在全球各 Region,数据采集也是分层、分布式部署,以此满足数据分布式采集和对接的能力;
安全的数据采集和对接:数据源系统不能由于对接出现故障,采集和对接需进行流控,以降低对数据源系统可靠性的影响。
数据存储和服务子系统
数据存储和服务子系统将采集到的海量数据进行分布式存储。由于经营各模块产生的数据格式差异较大,存储模块提供了数据降噪、降维、压缩、清洗等预处理功能,通过对数据的时间序列化处理为周边系统提供数据服务。
该子系统通过不断积累数据,构建了包含故障经验模式库、经营操作模式库、调度优化数据库、监控画像模式库等在内的关键数据资产,助力运维和运营水平的提升。
数据分析和建模子系统
数据分析和建模子系统提供了大数据和 AI 算法的运行环境,业务专家、算法和模型专家基于此进行了数据探索,算法和模型开发运行通过插件化、任务调度管理能力,使得周边系统可快速处理数据并获取结果。
更进一步,该子系统支撑了多种不同运行环境、不同语言编写的算法,通过多版本管理、参数配置自动化推送、仿真迭代自学习等,提升算法和模型的上线效率和智能化水平。
资源池经营子系统
资源池经营子系统面向资产经营、运维、客户支撑、产品研发、算法模型等团队提供资源池的经营管理能力。通过指标大屏、管理 Console、报表等实现全面、实时查看资源池的经营状态。
该子系统在实际经营过程中,构建了全面的分析能力和指标体系,例如:
面向资产精细化经营:分配率预测、闲置分析、供货分析等
面向高性能分布式调度:热点分析、碎片分析、调度性能等
面向高可靠运维:故障智能分析、资产健康度打分、上线效率分析等
业务创新子系统
为进一步发挥数据的价值,业务创新子系统通过分析和推荐能力,驱动已有产品的创新和改进,提供新的产品和服务供用户使用。
以下为瑶光智能分析和规划平台,驱动的两个创新应用示例:
HECS(云耀云服务器)
HECS 是华为云推出可以快速搭建应用、简单易用的新一代云服务器,有着易开通、易搭建、易管理等特点,适用于网站搭建、开发环境等低负载应用场景。
由瑶光智慧云脑对其提供技术支持,打造“极优,极简”的云上体验,全面释放技术红利;
智能推荐
华为云目前提供的产品和服务越来越丰富,包含了 X86、鲲鹏、昇腾等多样算力,包年包月、按需、预留、竞价等灵活的计费模式。
为了方便用户选购适合的产品,智能推荐结合大数据分析,提供了产品购买建议,后续结合画像、多元算力匹配等高级功能,即将提供更加高级的推荐能力。
面向云、AI、5G 时代,业务的创新也在驱动云服务提供商加速创新。华为云瑶光通过资源池分析和规划平台,支撑华为云经营朝着更加精细化、智能化、创新化的方向前进。
评论