在 2025 收官前,看清 Data + AI 的真实走向,点击查看 BUILD 大会精华版 了解详情
写点什么

使用 PolyBase 将 SQL Server 与 Hadoop 相结合

  • 2016-06-07
  • 本文字数:700 字

    阅读完需:约 2 分钟

最近发布的 SQL Server 2016 让开发人员可以使用 SQL 查询 Hadoop 和 Azure blob 存储。这是一项之前在 SQL Server 并行数据仓库中提供的技术,名为 PolyBase

和链接服务器一样,PolyBase 会设法将尽量多的处理工作转移到源数据库。也就是说,当查询 Hadoop 或 Azure blob 存储时,会生成恰当的 map/reduce 操作。这就是所谓的“下推(pushdown)”,下面是一些开发人员需要了解的下推限制:

SQL Server 允许对以下基本表达式和操作符做谓词下推:

  • 用于数值、日期、时间值的二元比较操作符(<、>、=、!=、<>、>=、<=);
  • 算术运算符( +、-、*、/、%);
  • 逻辑运算符(AND、OR);
  • 一元运算符(NOT、IS NULL、IS NOT NULL)。

文档接着写到:

BETWEEN、NOT、IN 和 LIKE 操作符可能也可以下推。这取决于查询优化器如何将它们改写为一系列使用基本关系运算符的语句。

下推可以通过 OPTION (FORCE EXTERNALPUSHDOWN) 显式启用,或通过 OPTION (DISABLE EXTERNALPUSHDOWN) 显式禁用。

将关系型和非关系型数据相结合

由于 PolyBase 是基于普通的 T-SQL,所以开发人员可以使用像连接这样的常见操作。这意味着,你可以在 Hadoop 集群中执行 map-reduce 操作,然后在一个查询中将执行结果和 SQL Server 数据库的表相连接。

导入 / 导出

在 SQL Server、Hadoop 和 Azure blob 存储之间移动数据不再需要外部的 ETL 过程或工具。相反,你可以像操作任意两个普通表一样,使用相同的 INSERT INTO/SELECT FROM 语法。从开发人员的角度来看,Hadoop 和 Azure blob 存储只是配置数据库时多出来的两个可供选择的表类型。(从运维的角度来看,你仍然需要分别管理安全和备份。)

查看英文原文 Combine SQL Server with Hadoop Using PolyBase

2016-06-07 19:003009
用户头像

发布了 1008 篇内容, 共 450.4 次阅读, 收获喜欢 346 次。

关注

评论

发布
暂无评论
发现更多内容

文生视频的新时代:Sora 模型如何打破视频生成的边界

测吧(北京)科技有限公司

测试

FinClip助力小程序支付链路的事件分析与优化

xuyinyin

深入浅出 Vue3:组件与模板基础全解析

不在线第一只蜗牛

JavaScript vue.js 前端

DeepSeek加持!天润融通AI Agent打造真智能客服

天润融通

文字转语音的未来:OpenAI 语音模型的创新与应用

测吧(北京)科技有限公司

测试

天润融通解析:开源VS闭源,DeepSeek是最好选择吗?

天润融通

TiDB 助力广发银行新零售信贷业务管理平台上线

先锋IT

从音频到文本:OpenAI Whisper 如何重塑语音识别领域

测吧(北京)科技有限公司

测试

【HarmonyOS NEXT】获取正式应用签名证书的签名信息

冉冉同学

鸿蒙 HarmonyOS 鸿蒙应用开发 HarmonyOS NEXT

软件测试丨智能体(Agent)介绍

测试人

人工智能 软件测试

五种常见的DNS攻击类型及应对方式

防火墙后吃泡面

山石网科×阿里云通义灵码,开启研发“AI智造”新时代

阿里巴巴云原生

阿里云 云原生 AI程序员 AI程序员体验官

音频转文字技术探索:Whisper 模型的应用与挑战

测吧(北京)科技有限公司

测试

文生图技术:DALL·E 模型与生成艺术的融合

测吧(北京)科技有限公司

测试

我悟了!原来本地图片预览还能这样搞

Immerse

人工智能丨常见的计算机视觉的业务场景,计算原理和测试指标

测试人

图像识别的突破:视觉模型在零样本识别中的应用

测吧(北京)科技有限公司

测试

【天润融通走进蔚来汽车|如何用数字化营销+服务,助力车企逆势增长?】

天润融通

RealClip正式发布,开启轻量化数字内容交互新体验

xuyinyin

山石网科×阿里云通义灵码,开启研发“AI智造”新时代

阿里云云效

阿里云 云原生 AI程序员 AI程序员体验官

海量日志接入 Serverless 应用降本70%以上

阿里云大数据AI技术

大数据 elasticsearch Serverless 运维

【签约快讯|天润融通签约Wagas】

天润融通

Python 实现反转、合并链表有啥用?

威哥爱编程

Python 算法 链表

使用PolyBase将SQL Server与Hadoop相结合_AI&大模型_Jonathan Allen_InfoQ精选文章