QCon北京「鸿蒙专场」火热来袭!即刻报名,与创新同行~ 了解详情
写点什么

Apache Pinot 1.0 发布,提供实时的分布式 OLAP 数据存储

  • 2024-01-06
    北京
  • 本文字数:941 字

    阅读完需:约 3 分钟

Apache Pinot 1.0发布,提供实时的分布式OLAP数据存储

Apache Pinot 是一个使用 Java 编写的开源列式分布式数据存储系统。Pinot 通过在线分析处理 (OLAP) 来响应低延迟的多维分析 (MDA) 查询。


Pinot 最初在 2013 年作为 LinkedIn 的内部项目,用于支持分析解决方案,随后于 2015 年 6 月基于 Apache 2.0 许可开源。该项目于 2019 年 6 月成为 Apache 软件基金会的一部分。


在 1.0 版本发布之前的一年中,社区解决了 300 多个问题,包括引入新特性、提高性能和 bug 修复。目前该项目在 GitHub 上有 130 多万行代码,由 300 多名贡献者进行维护。


Apache Pinot 最适合用于分析不可变的实时摄入数据,尤其是在查询具有多个维度和度量的时间序列数据时。该项目使用 Apache Helix 作为集群管理嵌入式代理,使用 Apache Zookeeper 进行集群状态和健康的协调和维护。


Pinot 提供快速查询,能够在几十毫秒的 P90 延迟内过滤和聚合 PB 级的数据。数据可以使用流式解决方案(如 Apache Kafka、Apache Pulsar 和 AWS Kinesis)实时摄入,也可以使用 Apache Hadoop、Apache Spark 和 AWS S3 进行批量摄入。Pinot 具备了水平伸缩性和容错性。可使用 Pinot 查询语言 (PQL)、SQL 或 Trino 和 Presto SQL 查询引擎查询数据。PQL 支持类似于 SQL 的功能:选择、聚合、分组、排序和过滤。


该版本的关键特性之一是多阶段查询引擎的功能完整性。默认查询执行引擎从未针对复杂查询(如分布式连接和窗口操作)进行过优化。多阶段查询引擎支持多阶段运算符,如实时分布式连接和窗口操作,并配备了新的最小化了数据重洗的查询计划优化器。Apache Pinot 的文档解释了如何启用多阶段查询引擎。


入门指南描述了如何在本地、Docker、Kubernetes 或 Azure、GCP 、 AWS 公共云上运行 Pinot。下面的命令用于使用预加载的棒球数据集来运行 Pinot:


docker run \      -p 9000:9000 \      apachepinot/pinot:0.12.0 QuickStart \      -type batch
复制代码


快速入门示例提供了不同的示例和所有可用的启动命令。


更多详细信息可在发布说明和 Apache Pinot 1.0 的公告中找到。StarTree 开发者关系副总裁 Tim Berglund 在 YouTube 上介绍了 Apache Pinot 1.0 并解释了 Apache Pinot 的一般性情况。Apache Pinot Meetup Group 定期组织会议,开发者可在 Slack 上提问。


原文链接

https://www.infoq.com/news/2023/12/apache-pinot/


2024-01-06 08:0011401

评论 3 条评论

发布
用户头像
1
2024-01-08 17:02 · 江苏
回复
2
2024-01-08 17:06 · 江苏
回复
3
2024-01-08 17:06 · 江苏
回复
没有更多了
发现更多内容

卓越笔触:打造高质量文章的艺术与科学

京东科技开发者

京东鸿蒙上线前瞻——使用 Taro 打造高性能原生应用

京东零售技术

鸿蒙

精准电商营销:基于京东商品详情API返回值的数据分析

技术冰糖葫芦

api 网关 API Gateway API 测试 API 策略 pinduoduo API

构建Web3社交平台:DeBox式DApp开发全攻略

区块链软件开发推广运营

交易所开发 dapp开发 链游开发 NFT开发 代币开发

从管控角度谈慢SQL治理

不思jo

《代码整洁之道》-大师眼中的整洁代码是什么样

京东科技开发者

加密货币市场持有与价格波动:CFI调查揭示的趋势与未来展望

区块链软件开发推广运营

交易所开发 dapp开发 链游开发 NFT开发 代币开发

华为应用市场:用户为首,技术领先,筑牢应用安全“第一道防线”

最新动态

由点到面,英特尔与腾讯持续深耕云、网络、存储等领域

E科讯

《从零构建Rust生产级服务》中文版出版!!!

简单

rust语言

京东.Vision —— 空间计算时代的用户购物之旅

京东科技开发者

驾驭复杂市场,商品计划软件:企业制胜的智囊团

第七在线

如何使用 StarRocks 管理和优化数据湖中的数据?

镜舟科技

数据湖 数据处理 分布式架构 StarRocks

阿里巴巴中国站商品搜索API返回值解析与实战

技术冰糖葫芦

api 网关 API Gateway API 测试 API 策略 pinduoduo API

在stable diffussion中完美修复AI图片

程序那些事

程序那些事 Stable Diffusion

京东商品评论数据接口:洞察消费者心声的重要渠道

tbapi

京东API接口 京东商品评论接口

Reflection 70B 遭质疑基模为 Llama 3;Replit Agent:编程 0 基础适用丨 RTE 开发者日报

声网

软件测试学习笔记丨Postman基础使用

测试人

软件测试 Postman

海外云手机有哪些推荐?

Ogcloud

云手机 海外云手机 云手机推荐 手机群控 ogphone云手机

ICE 8月各项板块盈利报告,人工智能与高频交易驱动稳定收益

科技热闻

三分钟带你看懂,低代码开发赋能办公方式转变

不在线第一只蜗牛

低代码

大奖收割机!望繁信科技荣获年度技术创新和应用品牌奖

望繁信科技

数字化转型 流程挖掘 流程资产 流程智能

收藏!打造高质量技术文章的8个技巧

京东零售技术

写作 企业号9月PK榜

策略游戏推荐:英雄无敌3 (Win&Mac) 支持M1

你的猪会飞吗

Mac游戏推荐 Mac游戏分享 单机游戏

别让代码愁白头发!15 个 Python 函数拯救你的开发生活

不在线第一只蜗牛

Java Python

数据库上云有多轻松?华为云技术专家带你玩转云数据库API

华为云开发者联盟

《代码整洁之道》-大师眼中的整洁代码是什么样

京东零售技术

后端 代码

等待风起——京东.Vision项目参与实录分享

京东零售技术

Vision pro 京东.vision

Apache Pinot 1.0发布,提供实时的分布式OLAP数据存储_实时计算_Johan Janssen_InfoQ精选文章