写点什么

性能问题损伤 SQL Server 2008 的全文检索

  • 2008-11-17
  • 本文字数:971 字

    阅读完需:约 3 分钟

首先,一些不熟悉全文检索背景的人。一般来说,计算机科学术语全文检索只是意味着你在文档中搜索所有的文本。对付全文检索的另一种选择是查找元数据,例如标题和关键字。

对SQL Server 而言,全文检索提供了存储在关系数据库或者是文件系统上的文本的高级搜索能力。搜索并不局限于字符串,应用程序所能理解的例如词干分析。这使得搜索“swim”,也返回“swims”, “swimming”,和“swam”。 它也可以支持权重搜索,即某些词比其他的词更重要,并可以搜索两个彼此相邻的词语。根据搜索条件的结果可以进行一个排名。

之前版本的全文检索是一个外部服务,和SQL Server 并排运行的服务。这样设计,参与索引的表和列的数据不得不从SQL Server 运送到全文检索服务。全文检索编目不能与其他的数据库一起备份,而且两个服务不能轻松的共享内存和CPU 资源。

为了处理这些和其他的问题,SQL Server 2008 把全文检索移到数据库中。现在SQL Server 自身可以动态管理服务器资源,为服务自动管理改变内存和CPU 资源配额。不幸的是,开发人员遇到了这种设计的一些意外结果。

他们依然会碰到的特定问题是事务。在一个事务性的数据库中,SQL Server 要时刻遵守 ACID 的规则。这意味着在搜索的时候行、页或甚至整个表都被锁定。通常情况下不会太坏,但是 Brent Ozar 解释说,错误的搜索会让事情变得复杂。

如果你在修正版(Revisions)上进行全文检索并且包含一些常见的关键字,像 SQL 滞留,则需要匹配数以万计的记录。当我们查看一下查询计划的时候,我们看到有 50-100k 的读操作。在表里面做这样的事情,也会获得沉重的表插入,事务性的灾难。

Jeff Attwodd 继续说道,

我们的 stackoverflow.com 很大程度上依赖于全文检索, 在 SQL Server 2005 下面工作得很好。不幸的是在 SQL Server 2008 下的情况则不同。 Brent 正在和 SQL Server 团队跟进这件事,他们用我们的数据库拷贝进行测试。[…] 根据目前为止出奇的差的 SQL Server 2008 全文检索和明显的体系结构更改,我对 SQL 团队能够为我们做些什么感到悲观。

他们所指的网站 StackOverflow 将计划不再长期使用全文索引。他们已经规划出迁移到竞争的搜索引擎 Lucene.Net 上。但是那些计划继续使用全文检索的人,在 SQL Server 2005 升级到 2008 以后需要在这方面进行彻底的测试。

查看英文原文: Performance Problems Mar SQL Server 2008 Full Text Search

2008-11-17 08:442333
用户头像

发布了 45 篇内容, 共 73028 次阅读, 收获喜欢 1 次。

关注

评论

发布
暂无评论
发现更多内容

【Java面试宝典】带你拿offer

钟奕礼

Java 面试 java;

图像匹配几种常见算法与实践

霍格沃兹测试开发学社

50道Java集合高频面试题,看完面试成功率99%

钟奕礼

Java 面试 java;

栓Q了,大厂被强制毕业,空窗一个月死背八股文,还好拿到了Offer

Geek_0c76c3

Java 数据库 开源 架构 开发

行业方案|“医疗”行业智能运维解决方案介绍

云智慧AIOps社区

监控 智能运维 智能优化算法 自动化运维 IT解决方案

Jenkins实践——创建Pipeline的两种方式

霍格沃兹测试开发学社

技术分享 | web自动化测试-文件上传与弹框处理

霍格沃兹测试开发学社

JDK RMI探索与使用--序列化

霍格沃兹测试开发学社

图像匹配几种常见算法与实践

霍格沃兹测试开发学社

Java程序员不得不会的124道面试题(含答案)

钟奕礼

Java 面试 java;

GOPS现场 | 芯片行业需要怎样的版本管理工具——对话龙智大规模安全研发技术专家

龙智—DevSecOps解决方案

版本控制 版本管理工具 版本管理 版本控制工具

ITSM | Atlassian ITSM终极指南,重构IT、运营和支持的工作方式

龙智—DevSecOps解决方案

ITSM ITSM解决方案

通过Inotify-tools 监听文件夹并同步文件至FTP服务器

皮特王

8年经验面试官详解 Java 面试秘诀

钟奕礼

Java 面试 java;

GOPS现场 | 大规模团队如何实现Jenkins的集中管理——对话龙智技术顾问

龙智—DevSecOps解决方案

jenkins 管理Jenkins

Mongodb的分页优化及索引使用

霍格沃兹测试开发学社

狂刷《Java权威面试指南(阿里版)》,冲击“金九银十”有望了

程序知音

Java 阿里 后端技术 Java面试题 Java面试八股文

600+ 道 Java面试题及答案整理(建议收藏)

钟奕礼

Java 面试 java; Java 面试题

Baklib每日分享|在线产品手册的制作技巧

Baklib

BUG 修复预估模型

霍格沃兹测试开发学社

Baklib知识分享|知识库对企业来说有哪些意义?

Baklib

重铸资源合集之荣光,吾辈义不容辞!!

掘金安东尼

前端 9月月更

Android R给自家UA工具挖坑

霍格沃兹测试开发学社

前端代码优化小技巧

霍格沃兹测试开发学社

知识管理在企业业务中如何体现其价值

Baklib

利用 zabbix 监控服务端口

霍格沃兹测试开发学社

​小长假要到了,来偶遇吗?

腾讯云数据库

数据库 腾讯云 tdsql 腾讯云数据库

天了噜,原来有效的复盘要这样做,微妙!

博文视点Broadview

APISIX的安装和简单使用

飞翔

GitHub无抗手!MySQL DBA攻坚指南一出,阿里数据库专家都解脱了

Geek_0c76c3

Java 数据库 开源 程序员 架构

彻底搞懂nodejs事件循环

coder2028

node.js

性能问题损伤SQL Server 2008的全文检索_.NET_Jonathan Allen_InfoQ精选文章