写点什么

360 开源 Quicksql:更简单,更安全,更快速的跨数据源统一 SQL 查询引擎

  • 2019-01-09
  • 本文字数:1455 字

    阅读完需:约 5 分钟

360开源 Quicksql:更简单,更安全,更快速的跨数据源统一SQL查询引擎

引言

话说天下大势,合久必分, 分久必合。 ——罗贯中大大


SQL 的世界也是如此。最初 ANSI 仅仅对 SQL 提出了一种标准,于是各个数据存储厂商都自己定制了专门的 SQL 语法。也因为此,在工作中,我们常常会遇到这样的场景:


小明,刚刚参加工作,第一个任务便是查询从没接触过的 Hive 中的数据。前辈说,不要担心,你直接用查 MySQL 的 SQL 语句查询就好。小明颤颤巍巍写下了第一个 SQL 查询语句,确实能跑。但是随着业务复杂度增加,SQL 的复杂度也随之提升,他渐渐发现 Hive 和 MySQL 的 SQL 语法并不完全一样,平时查询需要区别对待,不停切换。他想知道,有没有一种 SQL 可以支持业内主流的数据存储引擎?


小红,参加工作 2 年。已经学会使用 MySQL、Hive、Oracle 等不同存储引擎的 SQL 语句查询数据。这时,上司说要引入 Elasticsearch。她发现这个数据存储引擎并不能通过 SQL 查询,而是需要编写复杂的 json 查询。渐渐地,她发现类似的存储引擎越来越多,Druid、Redis、Mongo、HBase 等,并且每一种都需要采取不同的方式查询数据,分析一个业务场景所需要切换的查询方式也越来越多。她想知道,可不可以使用 SQL 语言查询 No-SQL 乃至 New-SQL 的数据存储?


所以嘞,Quicksql(简称 QSQL)诞生啦!

Quicksql 是什么

Quicksql 是一个更简单,更安全,更快速的跨数据源统一 SQL 查询引擎。它帮助用户减少在使用不同数据引擎时需要的学习成本和切换成本,忽略不同数据引擎底层存储和数据查询方式的差异,使用户仅需要关注查询的业务逻辑和数据本身。

Quicksql 能做什么?

  1. 统一 SQL 语法:提供统一 SQL 语言,支持不同结构化数据存储查询,方便用户学习。

  2. 多数据存储引擎查询:提供 SQL 查询 No-SQL\New-SQL 等数据存储引擎,方便使用。

  3. 数据联邦:支持跨数据源查询,例如 MySQL join Elasticsearch union Hive。

  4. 方便扩展:分层灵活,Quicksql 可以很方便的扩展多种数据源(Druid、Mongo 等),扩展多种计算引擎(Spark、Flink 等)。

如何使用 Quicksql?

Quicksql 现在提供三种对外服务方式:命令行,API 和 JDBC 连接。


  • 命令行: 根据 Quicksql 的 Github 主页相关说明,用户可以很容易的进行 Quicksql 的部署。部署完成后,Quicksql 提供了脚本模式,支持使用类似 “qsql -e [SQL]” 这样的命令进行数据查询。

  • API: 为方便开发者用户使用,Quicksql 提供了一套 API 方便开发程序调用。与 Spark、Storm 等现有的引擎类似,Quicksql API 在使用中需要先定义环境参数(任务名,执行引擎,查询最大返回条数等),然后进行 SQL 的查询和任务的提交。关于 API 的用法详情可以参考 Quicksql example。

  • JDBC: Quicksql 还实现了 JDBC 的接口,用户可以像连接 MySQL 一样通过 JDBC 方式连接 Quicksql 进行数据查询。

Quicksql 是怎么实现的?

Quicksql 基于 Apache Calcite 提供的多数据引擎 SQL 语义适配功能,基于 ANSI 发布的 SQL 2003 标准和用户的使用习惯上,重新定义并扩展部分 SQL 语义,对用户提供了统一的 SQL 语言。在内部,Quicksql 会根据用户所查询的 SQL 语句,在原语义的基础上,进行解析转化等操作,最终根据数据引擎特性将用户的查询语义完整的转化为数据引擎可执行的 SQL 语句。Quicksql 还拥有智能选择功能,可以根据该 SQL 的引擎特性决定最快速最高效的数据查询方式,例如,当 Quicksql 分析得出查询语句是一个混合查询,它就会自动选择启动集群模式(默认是 Spark)进行数据处理。



想知道更多?这里就是开源主页啦: https://github.com/Qihoo360/Quicksql


有问题还可加入 QQ 群和 360 的技术人员一起交流。QQ 群号:932439028


2019-01-09 08:4512278
用户头像

发布了 1459 篇内容, 共 688.5 次阅读, 收获喜欢 2483 次。

关注

评论 2 条评论

发布
用户头像
q请问,这个可以用来做多租户吗?
2020-12-16 14:56
回复
用户头像
不错的项目,试试ES查询
2019-01-09 09:30
回复
没有更多了
发现更多内容

RocketMQ x OpenTelemetry 分布式全链路追踪最佳实践

阿里巴巴云原生

阿里云 RocketMQ 云原生

轻松搞懂云成本优化:FinOps,2023年一定要懂的热点趋势!

博文视点Broadview

使用 DataEase 展示服务器运行状态

搞大屏的小北

Linux监控 Linux监控脚本 监控展示 监控大屏

“ChatGPT们”的淘金时代

OneFlow

「高频必考」Docker&K8S面试题和答案

王中阳Go

Docker 高效工作 学习方法 面试题 Go 语言

腾讯云数据库性能打破世界纪录 每分钟可处理8.14亿笔交易

数据库小组

数据库 腾讯云 tdsql

从制作九转大肠来谈起 | GreptimeDB 如何提高多步操作的容错能力

Greptime 格睿科技

数据库 云原生 时序数据库 procedure

一文讲透|如何部署OceanBase社区版(4.x版)

OceanBase 数据库

数据库 oceanbase

pulsar:创建更多租户 VS 创建更多namespaces

李code

架构 pulsar 调优 业务

从人工智能角度看人肉智能

FN0

AIGC

个人开发者应该如何选购云服务

光毅

AI的道德风险验证

陈磊@Criss

一文读懂HAG:首个永久锚定BTC Mining算力的Security Token

股市老人

探索Python Web后端技术的发展之路

阿呆

深入探讨Python Tornado框架:原理与异步实现

阿呆

Python tornado Web

「行业化」会是ToB巨头们的新战场吗?

ToB行业头条

一文读懂mysql锁

Paincupid

MySQL MySQL锁 mysql锁原理 mysql如何上锁 msyql锁分类

DevOps |如何说清楚研发效能工作的价值?

laofo

DevOps cicd 研发效能 持续交付 研发效能度量

碳基大模型--人一生处理多少个token?

FN0

人工智能 AIGC ChatGPT

世界备份日|有“备”而来,才能不为数据安全“蕉绿”

云布道师

存储

设计原则 — I 接口隔离原则

Lemoon Can

接口隔离原则 设计原则

矩阵起源荣获“IT用户满意度大会”年度新秀称号

MatrixOrigin

MatrixOrigin MatrixOne

Activity初窥门径

芯动大师

android App Activity

AI又火了,这一次云厂商能赚到钱吗?

脑极体

云计算 AI 云厂商

Sync包Mutex的原理阐述

Jack

golang

AIGC热门技术岗平均年薪超百万,脉脉林凡认为白领可能先于蓝领失业

科技热闻

电商通用型商品中心设计

京东科技开发者

构架 企业号 3 月 PK 榜 电商中心 SKU 类目

如何使用 MegEngine 生态落地一个算法

MegEngineBot

开源 性能优化 MegEngine 算法落地

职场「OKR」,魔幻又内卷

Java 架构 职场 OKR

秒懂算法 | Treap树

TiAmo

数据结构 算法 节点 旋转法

MobPush 厂商通道SDK集成指南

MobTech袤博科技

360开源 Quicksql:更简单,更安全,更快速的跨数据源统一SQL查询引擎
_数据库_InfoQ 中文站_InfoQ精选文章