写点什么

使用 PolyBase 将 SQL Server 与 Hadoop 相结合

  • 2016-06-07
  • 本文字数:700 字

    阅读完需:约 2 分钟

最近发布的 SQL Server 2016 让开发人员可以使用 SQL 查询 Hadoop 和 Azure blob 存储。这是一项之前在 SQL Server 并行数据仓库中提供的技术,名为 PolyBase

和链接服务器一样,PolyBase 会设法将尽量多的处理工作转移到源数据库。也就是说,当查询 Hadoop 或 Azure blob 存储时,会生成恰当的 map/reduce 操作。这就是所谓的“下推(pushdown)”,下面是一些开发人员需要了解的下推限制:

SQL Server 允许对以下基本表达式和操作符做谓词下推:

  • 用于数值、日期、时间值的二元比较操作符(<、>、=、!=、<>、>=、<=);
  • 算术运算符( +、-、*、/、%);
  • 逻辑运算符(AND、OR);
  • 一元运算符(NOT、IS NULL、IS NOT NULL)。

文档接着写到:

BETWEEN、NOT、IN 和 LIKE 操作符可能也可以下推。这取决于查询优化器如何将它们改写为一系列使用基本关系运算符的语句。

下推可以通过 OPTION (FORCE EXTERNALPUSHDOWN) 显式启用,或通过 OPTION (DISABLE EXTERNALPUSHDOWN) 显式禁用。

将关系型和非关系型数据相结合

由于 PolyBase 是基于普通的 T-SQL,所以开发人员可以使用像连接这样的常见操作。这意味着,你可以在 Hadoop 集群中执行 map-reduce 操作,然后在一个查询中将执行结果和 SQL Server 数据库的表相连接。

导入 / 导出

在 SQL Server、Hadoop 和 Azure blob 存储之间移动数据不再需要外部的 ETL 过程或工具。相反,你可以像操作任意两个普通表一样,使用相同的 INSERT INTO/SELECT FROM 语法。从开发人员的角度来看,Hadoop 和 Azure blob 存储只是配置数据库时多出来的两个可供选择的表类型。(从运维的角度来看,你仍然需要分别管理安全和备份。)

查看英文原文 Combine SQL Server with Hadoop Using PolyBase

2016-06-07 19:002484
用户头像

发布了 1008 篇内容, 共 396.9 次阅读, 收获喜欢 345 次。

关注

评论

发布
暂无评论
发现更多内容

Kyligence 荣登甲子光年 2023 AIGC 技术应用领域最具商业潜力榜

Kyligence

数据分析 智能决策

flutter 代码混淆

一款最近很火的开源低代码平台

伤感汤姆布利柏

开源 低代码

软件测试/人工智能丨大语言模型LangChain

测试人

人工智能 软件测试

诚迈科技亮相OpenHarmony人才生态大会,共话校企协同育才

新消费日报

Navicat Premium 16 for Mac:一站式数据库管理解决方案

iMac小白

首届中国研究生操作系统开源创新大赛即将启动:开启创新之旅,推动开源繁荣

新消费日报

基于模型驱动的可视化开发平台——JNPF

高端章鱼哥

低代码 可视化开发 JNPF

分析商品详情页中的数据,以了解产品的特点和优势

技术冰糖葫芦

API 接口

低代码开发:产品验证的破局之道

幂简集成

产品 工具 低代码 数字化 API

SD-WAN实现分公司与总部组网高效互联

Ogcloud

网络 SD-WAN 组网

2023-12-13:用go语言,密码是一串长度为n的小写字母,一则关于密码的线索纸条, 首先将字母a到z编号为0到25编号, 纸条上共有n个整数ai,其中a1表示密码里第一个字母的编号, 若i>1的

福大大架构师每日一题

福大大架构师每日一题

Trace 在多线程异步体系下传递

观测云

Trace 链路

量化交易与人工智能:技术的交叉引发金融市场的变革

不在线第一只蜗牛

人工智能 金融 量化交易

HarmonyOS NEXT分布式系统硬件资源池应用场景技术原理及接入实践

新消费日报

天谋科技荣获国家高新技术企业认证

Apache IoTDB

Java中的泛型通配符传递类型参数

技术冰糖葫芦

API 接口

软件测试/人工智能丨计算机视觉场景中,处理视频/图片数据并测试

测试人

dDapp发行代币合约质押挖矿系统开发丨详情开发

l8l259l3365

深度 | AI数据标注迈入自动化时代,26年老兵掘金全球智能汽车市场

澳鹏Appen

自动驾驶 数据标注 4D标注

Apache IoTDB PMC Chair 黄向东主办 2023 开放原子开发者大会开源工业物联网大数据分论坛,诚邀您的参加!

Apache IoTDB

物联网与低代码:构建智能化的连接世界

快乐非自愿限量之名

低代码 物联网 IoT

想突破转化瓶颈?安排上 AI ,比漏斗图更高效、更实用!

Kyligence

数据分析 转化分析

一起学Elasticsearch系列-搜索推荐

Java随想录

Java 大数据 elastic 搜索

用友系列之YonBuilder低代码平台概论和基本使用

阿Q说代码

低代码 用友

SD-WAN解决外贸企业网络问题

Ogcloud

网络 SD-WAN vpn MPLS 网络VPN

体育赛事为何成为各平台的“必争之地”与新兴变现模式

软件开发-梦幻运营部

入门PostgreSQL:安装和设置数据库的完整指南!

互联网工科生

postgresql

亚马逊云科技宣布推出四项Amazon Supply Chain新功能

财见

1.5万字 + 25张图盘点RocketMQ 11种消息类型,你知道几种?

快乐非自愿限量之名

RocketMQ 事务管理

使用PolyBase将SQL Server与Hadoop相结合_AI&大模型_Jonathan Allen_InfoQ精选文章