写点什么

SQL Server 2014 RTM 版本中的数据仓库

  • 2014-04-16
  • 本文字数:1678 字

    阅读完需:约 6 分钟

SQL Server 2014 RTM 版已在 4 月 1 日对外发布。在此,我们将揭露新版 SQL Server 的各个新特性,尤其是数据仓库的支持。

当然,我首先还是关注新版本的定价。

微软公司正在推动一种综合定价模式。这对他们来说非常重要,因为客户会把其与 Oracle 公司的菜单式定价模式相比较。Oracle 是按照处理器个数收费,每个约 10,000 至 23,000 美金,一开始便宜,但要获得它所有的功能,价格就增长至 47500/ 每个处理器。相比之下,SQL Server 企业版包含所有功能的前提下,统一价格 27000/ 每个处理器。

列存储

早在 9 月,我们披露了新的可更新的列存储表,而至今它还没有什么真正的新功能。然而,我们对如何使用它,还有更多的建议。

首先,确保你有足够的数据来证明它。 在一列存储表中每个水平分区可容纳多达一百万行记录。所以,如果你在一个单一的表中没有成千上万行数据,则这项技术对你而言并不合适。

另一个要考虑的是访问模式。相比于传统的行存储,在列存储结构中访问一整行相对昂贵。所以我要再次强调,除非你正在使用扫描范围的查询,否则你不应使用这种技术。

下图显示了一个典型查询的逻辑视图。注意整段和列如何被消除,以减少I/O 来处理查询。

在性能方面,大多数查询效率可提高至5 到10 倍。以一个基准来计算,它们比传统的表“惯用索引”节约了91% 的磁盘空间。

应该指出的是,虽然列存储表被认为是它们的“内存数据库”产品系列的一部分,但它们将内存池作为缓存使用,就像其他表一样。但不像一个内存优化表,你在启动时不必将整个表装载到内存。

基于可持续复制的云服务平台( Azure

使用 Windows Azure 的虚拟机主机的可持续复制副本,现在已经可以实现,但还有难度。这些只读的、且具有相同版本的数据库可以分散在不同物理位置,以改善延迟和提高数据消费的吞吐量,就像用于静态网页文件的CDN。由于它们是基于云的,因此人们理论上可以在需求高峰期启动新的服务器,而不是在硬件空闲时期。

SQL Server 2014 新版本的主要变化是向导工具。SQL ServerManagement Studio 内置向导将引导管理员选择虚拟机的大小和加载相应的加密密钥。

为了鼓励更多人使用这项服务,微软只收取了虚拟机、存储和出站流量的费用。从内部部署的 SQL Server 到 Azure 副本入口流量是免费的。

建立一个可持续复制副本时,选择正确的同步模式非常重要。异步更新的副本使得写入主数据库的速度更快,但可能会导致读取到过时的数据。 对于分析,寻找数周,数月,甚至数年的数据就没有问题。 这使得它非常适合采用列存储数据。

相反,同步更新允许用于 OLTP 数据的准确报告。但如果在主站和副本数据库之间有显著的延迟,那可能是严重的性能问题。因此,你不能把同步模式应用于物理上分散的服务器。

混合型数据库和数据归档

SQL Server 的新功能是能够创建真正的混合型数​​据库。 SQL Server 既可以运行于自身服务器上,也可以运行在 Azure 虚拟机上,当然它的部分或全部数据文件都在 Windows Azure 上存储。

Windows Azure 拥有足够大的缓冲池,在批量读取大量文件时,它能提供高效访问,保证性能。但可能会造成延迟问题,所以,这个功能在做数据归档时就显得非常有用。 比如,你可以运行分析过去十年的销售收据,又不用占用昂贵的 SAN 空间。

Windows Azure ExpressRoute**** 服务

减轻延迟问题的一种方法是通过使用 Windows Azure 的快速干线Windows Azure ExpressRoute 服务,而非 VPN 服务器的网络管道。这项服务提供了 Azure 数据中心与你本地设备之间的专用连接。

交换供应商提供 1 Gbps 和 10 Gbps 级得花费分别为每月 600 美金和 10000 美金。另外,每月超过 15/250TB 的流量费为 0.070/GB。

网络服务提供商提供了不同的定价模型。起价 10Mbps,每月 600 美元;封顶 1Gbps,每月 12000 美元。单一方向不收取流量费。

注意,目前这个网站上的价格反映了 50%预先折扣。

参考英文原文: Data Warehousing in SQL Server 2014 RTM


感谢侯伯薇对本文的审校。

给InfoQ 中文站投稿或者参与内容翻译工作,请邮件至 editors@cn.infoq.com 。也欢迎大家通过新浪微博( @InfoQ )或者腾讯微博( @InfoQ )关注我们,并与我们的编辑和其他读者朋友交流。

2014-04-16 07:401801

评论

发布
暂无评论
发现更多内容

58字节常量池面试题,你如何应对?

卢卡多多

intern 字符串 7月日更

在线条码生成器

入门小站

工具

【Kafka技术专题】「实践操作篇」单机部署实践手册(2.8.0)

洛神灬殇

kafka MQ kafka配置 消息队列 kafka架构

Docker的学习体验

吴脑的键客

,docker

大厂的产品研发流程,你知道么?

Simon郎

产品 研发体系 大厂 互联网公司

从鉴黄师到阿里程序员,我成功拿下阿里offer

白亦杨

Java 编程 程序员 计算机

不要让这2个坏习惯限制了你的成长

俞凡

认知

怎么才能写出100个用户体验的关键时刻?

石云升

读书笔记 用户体验 关键时刻 7月日更

极光开发者周刊【No.0723】

极光JIGUANG

学习下服务器端漏洞,受益匪浅!

网络安全学海

运维 网络安全 信息安全 漏洞扫描 渗透测试·

微观管理?

escray

学习 极客时间 朱赟的技术管理课 7月日更

上线仅7天,GitHub已标星48.4k!原来是阿里巴巴内部《高并发系统设计》

Java redis 编程 架构 面试

线上教育培训机构如何推广自己

石头IT视角

什么是 Druid

HoneyMoose

完整视频+源码!十六天带你精通基于Spring Cloud微服务电商项目

Java架构追梦

Java 架构 面试 微服务 SpringCloud

结构化流-Structured Streaming(八-下)

Databri_AI

spark 流式计算框架 structuredStreaming

C# 三个Timer

喵叔

7月日更

Apache Druid 简介

HoneyMoose

Go语言:运行时反射,深度解析!

微客鸟窝

Go 语言

加速基因测序进程,北鲲云高性能计算平台再发力

北鲲云

实践解析丨如何通过 WebAssembly 在 Web 进行实时视频人像分割

声网

大前端 WebRTC webassembly

我学编程时最后悔的事!

程序员鱼皮

Java c++ Python 大前端 后端

网络攻防学习笔记 Day83

穿过生命散发芬芳

网络攻防 7月日更

Linux之cal命令

入门小站

Linux

从鉴黄师到阿里程序员,我成功逆袭上岸

Java 编程 程序员 计算机

去阿里应聘P7Java岗,都会被问到哪些问题?

Java架构师迁哥

使用数据库乐观锁的方式解决数值累加的问题

陈靓-哲露

我应该在什么时候使用 Apache Druid

HoneyMoose

根据四个商业指标找到MOT

石云升

读书笔记 用户体验 商业洞察 关键时刻 7月日更

如何在Go 服务中做链路追踪

Rayjun

微服务 Go 语言

大三就拿到字节提前批,你不想成长,生活总会逼着你成长

Java架构师迁哥

SQL Server 2014 RTM版本中的数据仓库_架构_Jonathan Allen_InfoQ精选文章