写点什么

SQL Server 2014 RTM 版本中的数据仓库

  • 2014-04-16
  • 本文字数:1678 字

    阅读完需:约 6 分钟

SQL Server 2014 RTM 版已在 4 月 1 日对外发布。在此,我们将揭露新版 SQL Server 的各个新特性,尤其是数据仓库的支持。

当然,我首先还是关注新版本的定价。

微软公司正在推动一种综合定价模式。这对他们来说非常重要,因为客户会把其与 Oracle 公司的菜单式定价模式相比较。Oracle 是按照处理器个数收费,每个约 10,000 至 23,000 美金,一开始便宜,但要获得它所有的功能,价格就增长至 47500/ 每个处理器。相比之下,SQL Server 企业版包含所有功能的前提下,统一价格 27000/ 每个处理器。

列存储

早在 9 月,我们披露了新的可更新的列存储表,而至今它还没有什么真正的新功能。然而,我们对如何使用它,还有更多的建议。

首先,确保你有足够的数据来证明它。 在一列存储表中每个水平分区可容纳多达一百万行记录。所以,如果你在一个单一的表中没有成千上万行数据,则这项技术对你而言并不合适。

另一个要考虑的是访问模式。相比于传统的行存储,在列存储结构中访问一整行相对昂贵。所以我要再次强调,除非你正在使用扫描范围的查询,否则你不应使用这种技术。

下图显示了一个典型查询的逻辑视图。注意整段和列如何被消除,以减少I/O 来处理查询。

在性能方面,大多数查询效率可提高至5 到10 倍。以一个基准来计算,它们比传统的表“惯用索引”节约了91% 的磁盘空间。

应该指出的是,虽然列存储表被认为是它们的“内存数据库”产品系列的一部分,但它们将内存池作为缓存使用,就像其他表一样。但不像一个内存优化表,你在启动时不必将整个表装载到内存。

基于可持续复制的云服务平台( Azure

使用 Windows Azure 的虚拟机主机的可持续复制副本,现在已经可以实现,但还有难度。这些只读的、且具有相同版本的数据库可以分散在不同物理位置,以改善延迟和提高数据消费的吞吐量,就像用于静态网页文件的CDN。由于它们是基于云的,因此人们理论上可以在需求高峰期启动新的服务器,而不是在硬件空闲时期。

SQL Server 2014 新版本的主要变化是向导工具。SQL ServerManagement Studio 内置向导将引导管理员选择虚拟机的大小和加载相应的加密密钥。

为了鼓励更多人使用这项服务,微软只收取了虚拟机、存储和出站流量的费用。从内部部署的 SQL Server 到 Azure 副本入口流量是免费的。

建立一个可持续复制副本时,选择正确的同步模式非常重要。异步更新的副本使得写入主数据库的速度更快,但可能会导致读取到过时的数据。 对于分析,寻找数周,数月,甚至数年的数据就没有问题。 这使得它非常适合采用列存储数据。

相反,同步更新允许用于 OLTP 数据的准确报告。但如果在主站和副本数据库之间有显著的延迟,那可能是严重的性能问题。因此,你不能把同步模式应用于物理上分散的服务器。

混合型数据库和数据归档

SQL Server 的新功能是能够创建真正的混合型数​​据库。 SQL Server 既可以运行于自身服务器上,也可以运行在 Azure 虚拟机上,当然它的部分或全部数据文件都在 Windows Azure 上存储。

Windows Azure 拥有足够大的缓冲池,在批量读取大量文件时,它能提供高效访问,保证性能。但可能会造成延迟问题,所以,这个功能在做数据归档时就显得非常有用。 比如,你可以运行分析过去十年的销售收据,又不用占用昂贵的 SAN 空间。

Windows Azure ExpressRoute**** 服务

减轻延迟问题的一种方法是通过使用 Windows Azure 的快速干线Windows Azure ExpressRoute 服务,而非 VPN 服务器的网络管道。这项服务提供了 Azure 数据中心与你本地设备之间的专用连接。

交换供应商提供 1 Gbps 和 10 Gbps 级得花费分别为每月 600 美金和 10000 美金。另外,每月超过 15/250TB 的流量费为 0.070/GB。

网络服务提供商提供了不同的定价模型。起价 10Mbps,每月 600 美元;封顶 1Gbps,每月 12000 美元。单一方向不收取流量费。

注意,目前这个网站上的价格反映了 50%预先折扣。

参考英文原文: Data Warehousing in SQL Server 2014 RTM


感谢侯伯薇对本文的审校。

给InfoQ 中文站投稿或者参与内容翻译工作,请邮件至 editors@cn.infoq.com 。也欢迎大家通过新浪微博( @InfoQ )或者腾讯微博( @InfoQ )关注我们,并与我们的编辑和其他读者朋友交流。

2014-04-16 07:401876

评论

发布
暂无评论
发现更多内容

Raydium被盗造成巨额损失,但Zebec Protocol及其生态并未受影响

BlockChain先知

Design a messaging queue table in MySQL

David

#架构实战营

架构实战营 - 模块 2 作业

小圆

设备资产管理系统有什么用?

优秀

设备管理 设备资产管理系统

数据预处理

穿过生命散发芬芳

数据处理 12月月更

专利进阶(一):软件专利工程师浅谈如何针对计算机软件类专利申请进行技术挖掘

No Silver Bullet

专利 12月月更 软件专利工程师 技术挖掘

一文了解 Dubbo 的代码架构

Apache Dubbo

Java 开源 源码 微服务 云原生

模块2

KING

数据权限就该这么设计!!!

小小怪下士

Java 程序员 数据权限

Verilog语言的条件语句

芯动大师

Verilog Verilog语法 Verilog的条件语句

ABBYY FineReader PDF2023最新版下载

茶色酒

abbyy

SQL查找是否"存在",别再count了!

风铃架构日知录

MySQL 后端 Java、 java程序员 sql

2022 Gartner全球云数据库管理系统魔力象限发布 腾讯云数据库入选

科技热闻

聊聊好牛的 MySQL 日志设计!

风铃架构日知录

MySQL Java、 sql java\ Undo Log

Data Structure Basics in Python

无人之路

数据结构 Python.

ZBC陆续在主要CEX开启Staking成近期利好,锁定市场大部分流通量

西柚子

Atlassian FaaS 云开发平台Forge解析

填空时光

敏捷 Faas Atlassian Jira

实战整了一个后台服务,真香!

风铃架构日知录

多线程 线程池 网络 HTTP CGI

性能优化-内存泄漏、内存溢出、cpu占用高、死锁、栈溢出、FullGC频繁检测手段-总结与分享

C++后台开发

性能优化 后端开发 内存泄漏 linux开发 C++开发

ZBC陆续在主要CEX开启Staking,锁定市场大部分流通量成大利好

鳄鱼视界

Raydium被盗造成巨额损失,但Zebec Protocol以及$ZBC并未受影响

西柚子

ChatGPT:日常编程助手

无人之路

编程 ChatGPT

Vue进阶(贰零柒):Webpack 性能优化措施汇总

No Silver Bullet

性能优化 Vue webpack 12月月更

架构实战营模块8作业

冷夫冲

架构 构架 「架构实战营」

架构训练营-第10期-模块2作业

Geek_4db2d5

精华推荐 | 【深入浅出RocketMQ原理及实战】「性能原理挖掘系列」透彻剖析贯穿RocketMQ的事务性消息的底层原理并在分析其实际开发场景

洛神灬殇

分布式事务 RocketMQ 可靠消息最终一致 12 月 PK 榜

低代码丨仪表盘使用技巧—【倒计时】

优秀

倒计时 数据看板

架构训练营-模块一作业

Sam

架构实战营

Raydium被盗造成巨额损失,但Zebec Protocol以及$ZBC并未受影响

股市老人

数据权限就该这么设计!!!

风铃架构日知录

数据 优化 数据权限 rbac 数据库权限

SQL Server 2014 RTM版本中的数据仓库_架构_Jonathan Allen_InfoQ精选文章