写点什么

使用 PolyBase 将 SQL Server 与 Hadoop 相结合

  • 2016-06-07
  • 本文字数:700 字

    阅读完需:约 2 分钟

最近发布的 SQL Server 2016 让开发人员可以使用 SQL 查询 Hadoop 和 Azure blob 存储。这是一项之前在 SQL Server 并行数据仓库中提供的技术,名为 PolyBase

和链接服务器一样,PolyBase 会设法将尽量多的处理工作转移到源数据库。也就是说,当查询 Hadoop 或 Azure blob 存储时,会生成恰当的 map/reduce 操作。这就是所谓的“下推(pushdown)”,下面是一些开发人员需要了解的下推限制:

SQL Server 允许对以下基本表达式和操作符做谓词下推:

  • 用于数值、日期、时间值的二元比较操作符(<、>、=、!=、<>、>=、<=);
  • 算术运算符( +、-、*、/、%);
  • 逻辑运算符(AND、OR);
  • 一元运算符(NOT、IS NULL、IS NOT NULL)。

文档接着写到:

BETWEEN、NOT、IN 和 LIKE 操作符可能也可以下推。这取决于查询优化器如何将它们改写为一系列使用基本关系运算符的语句。

下推可以通过 OPTION (FORCE EXTERNALPUSHDOWN) 显式启用,或通过 OPTION (DISABLE EXTERNALPUSHDOWN) 显式禁用。

将关系型和非关系型数据相结合

由于 PolyBase 是基于普通的 T-SQL,所以开发人员可以使用像连接这样的常见操作。这意味着,你可以在 Hadoop 集群中执行 map-reduce 操作,然后在一个查询中将执行结果和 SQL Server 数据库的表相连接。

导入 / 导出

在 SQL Server、Hadoop 和 Azure blob 存储之间移动数据不再需要外部的 ETL 过程或工具。相反,你可以像操作任意两个普通表一样,使用相同的 INSERT INTO/SELECT FROM 语法。从开发人员的角度来看,Hadoop 和 Azure blob 存储只是配置数据库时多出来的两个可供选择的表类型。(从运维的角度来看,你仍然需要分别管理安全和备份。)

查看英文原文 Combine SQL Server with Hadoop Using PolyBase

2016-06-07 19:002936
用户头像

发布了 1008 篇内容, 共 442.5 次阅读, 收获喜欢 346 次。

关注

评论

发布
暂无评论
发现更多内容

资源管理系统Apache Mesos

穿过生命散发芬芳

10月月更 Mesos

Linux系统-基础IO

可口也可樂

Linux 10月月更 基础IO

Linux线程-同步与互斥

可口也可樂

Linux 线程 10月月更 同步与互斥

定时任务:历史 & 应用

agnostic

定时任务

云计算 Fusion Compute虚拟机挂载Tools 并给虚拟机配置静态IP

Python-派大星

10月月更

服务治理实施流程

阿泽🧸

10月月更 服务管理

Docker | redis集群部署实战

甜点cc

redis Docker 10月月更

MySQL超详细安装教程 手把手教你安装MySQL到使用MySQL 最简单的MySQL安装方式,这种方式装,卸载也简单(零基础入门MySQL)

Python-派大星

10月月更

云数据库助力电池云(一)

CnosDB

IoT 时序数据库 开源社区 CnosDB infra

leetcode 15. 3Sum 三数之和(中等)

okokabcd

LeetCode 数据结构与算法

Vmware虚拟机上CentOS8安装教程

DS小龙哥

10月月更

架构实战营模块3-外包学生管理系统架构设计文档

冷夫冲

架构 架构设计 架构训练营

Spring Boot概述(二)

Studying_swz

springboot 10月月更

数据结构-栈、队列、堆(java)

Studying_swz

数据结构 10月月更

JS逆向笔记

渔戈

JavaScript 逆向分析 10月月更

在线问题反馈模块实战(十五)​:实现在线更新反馈状态功能

bug菌

springboot 项目开发 10月月更

【kafka运维】TopicCommand运维脚本(1)

石臻臻的杂货铺

kafka 运维 10月月更

【kafka运维】ConfigCommand运维脚本

石臻臻的杂货铺

kafka 运维 kafka运维 10月月更

Jenkins把GitHub项目做成Docker镜像

程序员欣宸

Docker jenkins 10月月更

PyTorch (1) | PyTorch的安装与简介

timerring

PyTorch 10月月更

Vue3:认识侦听器watch🔥

渔戈

Vue 前端 10月月更

Linux线程-生产消费模型/线程池

可口也可樂

Linux 线程 10月月更

1亿条数据批量插入 MySQL,哪种方式最快?

小小怪下士

Java MySQL 程序员

HTTP缓存浅析与应用

甜点cc

前端 HTTP 10月月更

嘉宾预告(一) | 安全左中右 · 2022 XDR网络安全运营新理念峰会

未来智安XDR SEC

网络安全

MyBatisPlus学习

Studying_swz

mybaitsplus 10月月更

Linux项目实训一

渔戈

Linux Ubuntu系统环境 10月月更

交替合并字符串

掘金安东尼

算法 10月月更

Docker | 数据持久化与数据共享

甜点cc

Docker 运维 10月月更

VLAN原理和配置,交换机创建vlan的多种方法、三种接口模式的作用和配置方法、Access、Trunk、Hybrid接口的特性以及配置方法和命令

Python-派大星

10月月更

从项目制到产品制,日子变美好了吗?

刘华Kenneth

DevOps 敏捷 软件项目

使用PolyBase将SQL Server与Hadoop相结合_AI&大模型_Jonathan Allen_InfoQ精选文章