QCon北京「鸿蒙专场」火热来袭!即刻报名,与创新同行~ 了解详情
写点什么

SQL Server 2011 中基于列的存储方式

  • 2011-03-14
  • 本文字数:827 字

    阅读完需:约 3 分钟

和大多数主流数据库一样,如果表拥有聚集索引,那么 SQL Server 就会以 B- 树的方式存储,否则就会使用的方式存储。这两种方法本质上都是基于行的,其中每页中行的条数会根据总体上行的大小不同而不同。从SQL Server 2011 开始,微软为我们提供了第三种选择。SQL Server 会提供一种“列存储索引”,从而以列而不是行的方式来存储数据。

当使用数据规模为1TB、记录条数为十四亿四千万的表时,微软声称基于列的查询在CPU 时间上会有16 倍的提升,而在使用时间上会有455 倍的提高。在真实情况下,这意味着本来要耗费501 秒的查询,现在只需要1.1 秒就可以完成了。这项测试是在拥有32 个逻辑处理器和256GB 内存的计算机上执行的。

微软把每个列都隔离在自身的一组页中,从而达到了这种惊人的改善。当执行查询的时候,只会从磁盘载入位于结果集中的列。而包含其它列的页会被忽略。

这种方法相当于为每种我们所能想象到的列组合创建替代索引。然而,这种方式不会消耗大量的磁盘空间,它实际上会比传统的表占用更小的空间。由于SQL Server 的压缩会发生在页级别上,并且和行相比,列中的数据更容易重复,所以使用列存储索引的表将会拥有更高的压缩等级。

但暂时我们还不能轻易决定使用列存储索引。首先也是最重要的,它们是不可更新的。一旦创建了列存储的索引,那么就不允许在表上执行插入、更新或者删除等操作了。微软期望更多商店每天对数据进行刷新,否则就需要把数据做只读处理。在刷新周期中,我们会删除索引,更新数据,然后再重新建立索引。由于这肯定是代价昂贵的操作,所以我们可以使用垂直分区来把操作限制到逻辑表的子集范围内。

使用列存储的索引也会导致性能的降低。如果你使用大多数列,那么重新组合行会耗费大量的资源。这意味着OLTP 样式的查询应该避免这种方式,而对于OLAP 形式的查询,这种方式会比较有利。或者换句话说,如果你在编写“SELECT *”或者每次抓取一行数据,那么列存储索引就不适合你。

查看英文原文: Column-based Storage in SQL Server 2011

2011-03-14 07:052536
用户头像

发布了 340 篇内容, 共 134.4 次阅读, 收获喜欢 13 次。

关注

评论

发布
暂无评论
发现更多内容

鲲鹏秘籍显优势,原生开发闯江湖

脑极体

AI

Databend 基于青云 DeepSeek-V3 服务拥抱技术创新

Databend

AI客服系统的开发框架

北京木奇移动技术有限公司

软件外包公司 AI客服系统 AI客服

AIP智能体平台:开启AI新时代

大东(AIP内容运营专员)

人工智能

AI客服APP的开发

北京木奇移动技术有限公司

软件外包公司 AI客服系统 AI客服软件

一文读懂!多语言大模型数据研发在大模型时代的实战全解

阿里技术

openai AIGC

AI客服APP的技术难点

北京木奇移动技术有限公司

软件外包公司 AI客服系统 AI客服

解读 Flink Source 接口重构后的 KafkaSource

AutoMQ

云计算 大数据 flink kafka 云原生

【GreatSQL优化器-12】make_tmp_tables_info

GreatSQL

劳动争议调解系统(源码+文档+部署+讲解)

深圳亥时科技

再上层楼,让DeepSeek-R1在16G内存,无GPU的Windows笔记本上本地运行!

智领云科技

教程 ChatGPT DeepSeek-R1

Java 序列化:探索替代方案

FunTester

Zerto 10.0 Update 6 - 适用于本地、混合和多云环境的灾难恢复和数据保护

sysin

Zerto

Apache Kafka 中的认证、鉴权原理与应用

AutoMQ

云计算 云原生 鉴权 认证 Apache Kafka

芯盾时代数据安全产品体系,筑牢数据安全防线

芯盾时代

api 网关 数据脱敏 安全监测

Easysearch 证书:Windows 上创建自签名证书的 7 种方法

极限实验室

windows Certificate easysearch

就业驿站管理系统(源码+文档+部署+讲解)

深圳亥时科技

OpenWrt 24.10 OVF:在 ESXi 8.0、Fusion 13 和 Workstation 17 上运行 OpenWrt 的简单方法

sysin

openwrt

Palo Alto Cortex XSOAR 6.13 for Linux - 安全编排、自动化和响应 (SOAR) 平台

sysin

palo alto

SQL Server 2011中基于列的存储方式_.NET_Jonathan Allen_InfoQ精选文章