写点什么

使用 PolyBase 将 SQL Server 与 Hadoop 相结合

  • 2016-06-07
  • 本文字数:700 字

    阅读完需:约 2 分钟

最近发布的 SQL Server 2016 让开发人员可以使用 SQL 查询 Hadoop 和 Azure blob 存储。这是一项之前在 SQL Server 并行数据仓库中提供的技术,名为 PolyBase

和链接服务器一样,PolyBase 会设法将尽量多的处理工作转移到源数据库。也就是说,当查询 Hadoop 或 Azure blob 存储时,会生成恰当的 map/reduce 操作。这就是所谓的“下推(pushdown)”,下面是一些开发人员需要了解的下推限制:

SQL Server 允许对以下基本表达式和操作符做谓词下推:

  • 用于数值、日期、时间值的二元比较操作符(<、>、=、!=、<>、>=、<=);
  • 算术运算符( +、-、*、/、%);
  • 逻辑运算符(AND、OR);
  • 一元运算符(NOT、IS NULL、IS NOT NULL)。

文档接着写到:

BETWEEN、NOT、IN 和 LIKE 操作符可能也可以下推。这取决于查询优化器如何将它们改写为一系列使用基本关系运算符的语句。

下推可以通过 OPTION (FORCE EXTERNALPUSHDOWN) 显式启用,或通过 OPTION (DISABLE EXTERNALPUSHDOWN) 显式禁用。

将关系型和非关系型数据相结合

由于 PolyBase 是基于普通的 T-SQL,所以开发人员可以使用像连接这样的常见操作。这意味着,你可以在 Hadoop 集群中执行 map-reduce 操作,然后在一个查询中将执行结果和 SQL Server 数据库的表相连接。

导入 / 导出

在 SQL Server、Hadoop 和 Azure blob 存储之间移动数据不再需要外部的 ETL 过程或工具。相反,你可以像操作任意两个普通表一样,使用相同的 INSERT INTO/SELECT FROM 语法。从开发人员的角度来看,Hadoop 和 Azure blob 存储只是配置数据库时多出来的两个可供选择的表类型。(从运维的角度来看,你仍然需要分别管理安全和备份。)

查看英文原文 Combine SQL Server with Hadoop Using PolyBase

2016-06-07 19:002437
用户头像

发布了 1008 篇内容, 共 392.7 次阅读, 收获喜欢 344 次。

关注

评论

发布
暂无评论
发现更多内容

实现-最佳实践-沉淀与践行V3

南山

个人成长

实现-最佳实践-目标制定V3

南山

个人成长

实现-最佳实践-目标觉知V3

南山

个人成长

实现-最佳实践-学做一道菜V3

南山

个人成长

实现-最佳实践-蒜蓉扇贝V3

南山

个人成长

实现-最佳实践-要事第一V3

南山

个人成长

实践-最佳实践-时间管理V3

南山

个人成长

RTE 大会报名丨AI 时代新基建:云边端架构和 AI Infra ,RTE2024 技术专场第二弹!

声网

实现-最佳实践-个人介绍V3

南山

个人成长

实现-最佳实践-睡前复盘V3

南山

.net core集成Minio,构建一个文件存储的基础设施

为自己带盐

.net core Minio

如何选择工作任务跟踪软件?8大工具比较

爱吃小舅的鱼

任务管理 任务管理软件

实现-最佳实践-适应高度刺激V3

南山

个人成长

实现-最佳实践-精力管理V3

南山

个人成长

实现-最佳实践-人生规划V3

南山

个人成长

实现-最佳实践-资料查找V3

南山

个人成长

实现-最佳实践-创造心流体验V3

南山

个人成长

实现-最佳实践-分享演讲V3

南山

个人成长

实现-最佳实践-感恩日记V3

南山

个人成长

实现-最佳实践-权益维护抉择V3

南山

个人成长

实现-最佳实践-善于分享V3

南山

个人成长

天润融通发布微藤智能体平台,中国客户联络正式进入“智能体时代”

天润融通

实现-最佳实践-难事开头V3

南山

个人成长

实现-最佳实践-大模型提效V3

南山

个人成长

实现-最佳实践-个人复盘V3

南山

个人成长

社区来稿丨一个真正意义上的实时多模态智能体框架,TEN Framework 为构建下一代 AI Agent 而生

声网

实现-最佳实践-剁椒鱼头V3

南山

个人成长

实现-最佳实践-规划开头V3

南山

个人成长

中国移动研究院与华为举行"数联网(DSSN)合作备忘录"签约仪式

Geek_2d6073

华为openMind分论坛:赋能AI社区生态汇聚,推动AI创新发展智慧未来

Geek_2d6073

AI媒体工作流“出道” | 闪迪助力探索AI的实践与创新

Geek_2d6073

使用PolyBase将SQL Server与Hadoop相结合_AI&大模型_Jonathan Allen_InfoQ精选文章