2019年5月15日，华为在北京举办分布式数据库及存储新品发布会，重点发布了两款产品：业界首创的AI Native分布式数据库GaussDB和分布式存储产品FusionStorage 8.0。其中，GaussDB在发布之前就备受国内外媒体关注，不少媒体曾在文章中提及此举将对数据库老兵Oracle构成影响。

业界首个AI-Native数据库GaussDB

传统企业数据处理以结构化数据为主，数据库+BI应用为主要模式。智能时代，数据爆炸式增长，数据库系统规模越来越大，数据处理从结构化数据向结构化+非结构化的多样性数据处理转变，传统的人工维护方式将面临巨大挑战。因此，华为重定义数据库架构，将AI技术引入数据库，大幅提升数据库自动化管理和优化能力。

据介绍，GaussDB是业界首款AI-Native数据库，也是业界第一款支持ARM的企业级数据库。其有两大创新：一是首次将人工智能技术融入分布式数据库的全生命周期，实现自运维、自管理、自调优、故障自诊断和自愈。在交易、分析和混合负载场景下，基于最优化理论，首创基于深度强化学习的自调优算法，调优性能比业界提升60%以上；二是通过异构计算创新框架充分发挥X86、ARM、GPU、NPU多种算力优势，在华为实验室采用权威标准测试集TPC-DS进行测试的情况下，其性能比业界提升50%，排名第一。

根据了解，AI-Native数据库分为五个等级：

1、AI Advised，利用外挂AI引擎给出数据库优化建议，减少数据库管理员的负担；
2、AI Assisted，数据库内置AI引擎，实现在线辅助优化，提升数据库管理效率；
3、AI Enhanced，一方面将AI植入数据库内核组件、核心算法和数据结构，实现数据库自优化；
4、AI Assembled，实现数据库自愈并最优化AI；
5、AI Designed，通过AI技术实现数据库的设计、验证、开发，达到全场景智能和普惠AI的目的。

现场，华为通过案例演示了AI-Native数据库GaussDB的强悍性能，比如在OLAP分析场景和OLTP事务场景下，使用AI-Native智能调优模式平均比其他自动调优方法性能提升68%，比DBA调优提升54%。

华为提出的AI-Native数据库，除了用AI理念重构数据库内核和算法之外，还考虑了如何在通用计算摩尔定律濒临失效的情况下，利用GPU、NPU等AI芯片算力来大幅提升AI算法的性能。

目前，GaussDB支持本地部署、私有云、公有云等多种场景。在华为云上，GaussDB为金融、互联网、物流、教育、汽车等行业客户提供全功能、高性能的云上数据仓库服务。这也是华为发布会的很大不同，产品发布的那一刻基本已经成功落地实践。

华为的AI能力

对于华为的AI能力，想必不少开发者都有所耳闻。在去年的HUAWEI CONNECT 2018大会上，华为就曾推出ModelArts全流程平台，可以让开发者更快地上手 AI、更快地加速模型训练和部署；更懂开发者的视觉 AI 应用开发平台HiLens，搭载昇腾 310，因而可提供了强大的算力和存储空间，满足了较大的图像处理运算需求，甚至实现 1 秒百帧的处理能力及毫秒级人脸检测；离线的开发套件Atlas 200，方便开发者在离线状态下研究和开发。

众所周知，华为有一个“传说中的”2012 实验室，是华为探索未来科技无人区的主战部队。此前，InfoQ曾受邀参观了其中的诺亚方舟实验室，这是华为 AI 研发中心，展示的亮点为“人工智能能力演示”，如智慧终端的计算视觉、语音助手、推荐搜索；智慧企业的供应链大脑、问答系统等；热技术实验室则聚焦高集成封装、高密空冷、高效液冷/相变，展示器件低热阻、仿生散热器、相变液冷、声学降噪材料、流场可视化测试等技术。而此次发布的GaussDB，就是在2012实验室领导下开发的。

在 AI 领域，华为一直坚持从芯片开始往上做到应用框架，基本覆盖了人工智能的所有方向，换句话说，就是支持人工智能全栈全场景。截止2019年3月底，华为云共发布有59个服务，160+的功能。这很好得解释了为什么华为有能力开发业界首款AI-Native数据库GaussDB，并获得如此高的性能提升。

为什么是云？

如华为方面所言，GaussDB运行在云平台之上。其实，这个消息本身并不是很令人惊讶，即便是地位还算稳固的Oracle近年也一直在遵守云优先的策略，即功能更新会优先在云平台进行，这也可以理解为云业务拉新的一种手段。

传统的数据库体系结构已有30多年的历史，专为本地部署，本地存储和单机数据库实例而设计和优化，此后很长一段时间内，该体系结构未针对公有云环境进行优化。在公有云环境下，计算和存储通过网络分离以支持多租户数据库实例并 scale out 向两端扩展；并不要求单个节点的高可靠性。

举例来说，假设一个本地数据库的每个数据库实例都有本地存储，为了支持高可用性，通常部署一个备实例并使用数据库内部复制机制将数据库日志（MySQL binlog）发送到备实例重建数据库副本。目前，大多数云厂商都采用类似机制来支持云数据库高可用性。但是，这种内部复制机制并没有利用云存储已经通过存储层复制提供的可靠性，这导致大量存储和带宽浪费。实际上，备数据库实例可以通过云存储与主实例共享数据，不仅可以节省磁盘空间和带宽，还可以为云数据库服务提供快速RTO。

很明显，在将传统数据库迁移上云时，需要重新设计和优化数据库系统。过去几年，主要云供应商，比如 AWS，已经做了部分工作。预计未来几年，更多云和数据库供应商将遵循这一趋势，构建某种形式的云原生数据库技术。此外，Gartner 预测，到2019年，90％的云数据库架构将支持计算和存储分离。

因此，根据云平台设计并提供AI-Native数据库GaussDB显然是目前最合适的方式。过去几年，华为一直在努力发展云计算业务，主要是为数据中心提供服务器和其他设备，但该公司的研发实验室也在研究企业软件产品。根据华为年度报告显示，去年其企业业务部门(包括面向企业客户的服务器和其他产品)收入增长24%，至约110亿美元，约占该公司1,060亿美元总收入的10%。

据了解，这也不是华为云第一次在云平台对数据库进行探索。自2016年6月起，华为共发布了4大类共13个数据库服务。其中，多模数据库GeminiDB可以通过一种服务满足多个数据库需要。

此前，华为云自研的关系型数据库Taurus也曾公开亮相。作为华为云自研的最新一代云原生分布式数据库，Taurus完全兼容 MySQL 8.0，采用计算与存储分离、日志即数据的架构设计，支持1写15读，性能达到原生MySQL的7倍。

创作场景

华为发布业界首款 AI-Native 数据库，挑动了谁的神经？