写点什么

Oracle 正式发布 MySQL HeatWave Lakehouse,数据查询速度更快、扩展性更强

  • 2023-07-28
    北京
  • 本文字数:1768 字

    阅读完需:约 6 分钟

Oracle正式发布MySQL HeatWave Lakehouse,数据查询速度更快、扩展性更强

近日,Oracle 宣布推出MySQL HeatWave Lakehouse,让客户能够像在数据库内查询数据一样快地查询对象存储中的数据。


MySQL HeatWave Lakehouse 支持各种文件格式(例如 CSV、Parquet)和从其他数据库导出的文件,并且可以在同一查询中将对象存储文件数据与 MySQL 数据库中的数据相结合。对象存储中的文件由 HeatWave 直接查询,而无需将数据复制到 MySQL 数据库中。因此,在对象存储中查询数据方面,MySQL HeatWave Lakehouse 为查询处理、数据加载速度、集群预配时间和自动化奠定了新的可扩展性和性能标准。

 

甲骨文公司首席企业架构师 Edward Screven 表示:“超过 80%的数据存储在文件系统中,该数字还在不断增长。客户希望将各种外部数据与内部事务处理数据集成和分析,但处理起来往往过于复杂或成本太高。MySQL HeatWave Lakehouse 能够帮助客户将对象存储中的数据与数据库数据结合在一起,让客户能够轻松获得宝贵的实时洞察,同时显著提高查询性能并降低数据加载速度。”

对象存储中的数据查询速度,与数据库中的数据查询速度一样快

 

10 TB TPC-H*基准测试所示,使用 MySQL HeatWave Lakehouse 以常用文件格式查询对象存储中的数据的速度,与在 MySQL 数据库中查询数据的速度一样快。这是因为 MySQL HeatWave 的内置功能MySQL Autopilot 提供了基于机器学习的自动化,可以从查询执行中学习,并改进未来查询的执行计划。MySQL Autopilot 是 MySQL HeatWave 一项特别的创新功能。基于 Oracle 云基础设施远程软件服务(Oracle Cloud Infrastructure, OCI)的 MySQL HeatWave 采用 AMD EPYC™处理器。

 

AMD 数据中心解决方案业务小组执行副总裁兼总经理 Forrest Norrod 表示:“AMD 和 MySQL HeatWave 工程团队正在密切合作,合力优化 AMD EPYC 处理器与 MySQL HeatWave 的性能,以利用新的处理器功能。得益于本次合作,在 AMD EPYC CPU 驱动的 OCI 实例上运行 MySQL HeatWave 的 MySQL 客户可在关键业务工作负载方面获得较为突出的性价比,其中包括针对海量对象存储数据的实时分析。”


甲骨文公司中国区技术咨询部高级总监嵇小峰表示:“如今,任何一个企业的数据源会越来越多。对于一个制造业而言,有很多从生产线上留存下来的 IoT 的数据、MES 生产过程中的数据以及一些外部来数据,这些数据需要跟现在跑的生产系统一起来做 journal 的分析、查询。这时候外部数据源在对象存储里面的体量是非常大的。”

 

MySQL HeatWave 的性能源自于其横向扩展架构,该架构支持通过大规模并行来配置集群、加载数据和处理高达 512 个节点的查询。此外,MySQL Autopilot 的增强功能可自动为对象文件创建元数据,并动态适应底层对象存储的性能,确保在 OCI 区域中都能提供出色的性能。

 

MySQL HeatWave 是重要的云端服务,可在单一的 MySQL 数据库服务中提供事务处理、实时分析、机器学习、数据池查询和基于机器学习的自动化功能。作为 Oracle Distributed Cloud 策略的核心,MySQL HeatWave 在 OCI 中提供,在 Amazon Web Services 中原生提供,作为 Oracle Database Service for Azure 的一部分提供,以及通过 OCI Dedicated Region 在客户数据中心内提供。

客户、合作伙伴和分析机构如何评价?

 

Natura&Co 解决方案架构师 Fabricio Rucci 表示:“数据呈指数级增长,我们在数据湖中存储的数据量也是如此。能够使用标准 MySQL 语法,在数据库和对象存储中查询数据获得实时洞察,这一点对 Natura 而言非常重要。这为我们提供了新的机会,如果我们可以比竞争对手更快地分析所有的数据,就可能获得新的竞争优势。”

 

德勤咨询公司(Deloitte Consulting)云基础设施与工程团队负责人 Henry Tullis 表示:“无论是从对象存储加载数据,还是在对象存储上运行查询,HeatWave Lakehouse 都展示了良好的可扩展性。随着数据量以及 HeatWave 集群大小的增加,加载时间和查询时间几乎保持不变。HeatWave Lakehouse 在数据管理方面的这种横向扩展特性是高效处理大量数据的关键。”


Constellation Research 副总裁兼首席分析师 Holger Mueller 表示:“自大数据出现以来,大数据/湖仓一体查询的速度大大低于事务查询速度。MySQL HeatWave 打破了这一局面,证明了 Lakehouse 可以实现与事务查询同等的性能,这是很多人未曾听过、未曾想过的。通过查询性能奇偶校验,HeatWave 使 CxOs 无需再担心数据需要存储在哪里、如何查询数据。其中的秘诀在于能够优化查询的 HeatWave 的 Autopilot。HeatWave 团队再一次取得了业内突破性成果。”


2023-07-28 17:183685
用户头像
李冬梅 加V:busulishang4668

发布了 930 篇内容, 共 524.1 次阅读, 收获喜欢 1097 次。

关注

评论

发布
暂无评论
发现更多内容

Go RWMutex:高并发读多写少场景下的性能优化利器

陈明勇

Go golang 读写锁 三周年连更 RWMutex

阿里云DTS数据同步实施

乌龟哥哥

三周年连更

如何利用 Go 创建一个 Web 应用

宇宙之一粟

Go Web 服务端 客户端 三周年连更

灾备的级别和等级划分

穿过生命散发芬芳

灾备 三周年连更

异步编程|五分钟让你学会局部刷新Ajax技术

浅羽技术

Java ajax js jsp 三周年连更

成立3年,云服务厂商火山引擎全景扫描

B Impact

Sam Altman:巨型AI模型时代已结束, GPT-4是OpenAI最后成果

B Impact

Oracle EBS学习篇:Oracle EBS启用诊断功能

back_wang

Django笔记十六之aggregate聚合操作

Hunter熊

Python django 聚合 aggregate

我用ChatGPT的一些实践案例

石云升

AI ChatGPT 三周年连更

陆奇:“模仿”微软Copilot,结构性代际因边际成本转为固定成本

B Impact

美国To B软件公司受到ChatGPT“威胁”解析

B Impact

响应系统设置的事件

芯动大师

Configuration 响应系统 三周年连更

Prometheus实战-从0构建高可用监控平台(二)

小毛驴的烂笔头

Linux Prometheus

Nautilus Chain :基于模块化架构的Layer3正在走向成熟

股市老人

关于时间管理的一点建议

光毅

时间管理 Tech Lead

Kafkaide让IDEA开发者不在游走

扬_帆_起_航

kafka kafka manager

用Python也能画图?用Python来画个“python”

Bob

Python

Go语言并发编程核心-Channel的典型应用场景分析

Jack

TPU、TensorFlow—谷歌云“增强”AI 芯片团队,与微软云竞争AI云份额

B Impact

磁盘I/O性能监控的指标

阿泽🧸

三周年连更 磁盘IO

IDEA用上这十大插件绝对舒服

越长大越悲伤

IDEA idea插件

全面解析|搞懂Nginx这一篇就够了

浅羽技术

Java nginx 反向代理 服务器 三周年连更

OpenHarmony接收指定网络的状态变化通知

坚果

OpenHarmony 三周年连更

2022-04-25:给定两个长度为N的数组,a[]和b[] 也就是对于每个位置i来说,有a[i]和b[i]两个属性 i a[i] b[i] j a[j] b[j] 现在想为了i,选一个最

福大大架构师每日一题

golang 算法 rust 福大大

音视频八股文(5)--SDL音视频渲染实战。会使用就行,不需要深究。

福大大架构师每日一题

音视频 SDL 流媒体 福大大

2023 年 10 个最佳 Linux 桌面发行版,每个都是那么的漂亮!

wljslmz

三周年连更

Java 继承 Minio 实现文件上传、文件下载、文件删除等功能

Java架构历程

三周年连更

测试需求平台10-DBUtils优化数据连接与SQL Limit实现分页

MegaQi

测试平台开发 三周年连更

如何将 Java 文件转换为 InputStream?这两种方法很管用!

wljslmz

三周年连更

Oracle正式发布MySQL HeatWave Lakehouse,数据查询速度更快、扩展性更强_数据湖仓_李冬梅_InfoQ精选文章