速来报名!AICon北京站鸿蒙专场~ 了解详情
写点什么

Lucene 2.9:数字字段支持、新分析器及性能优化

  • 2009-09-27
  • 本文字数:583 字

    阅读完需:约 2 分钟

Apache Lucene 项目是一个完全用 Java 编写的高性能、全功能的文本搜索引擎库,最近它发布了 2.9 版。此次发布在 2.4.1 版的基础上进行了许多增强:

  • 单个 Segment 的查询及缓存,这使 reopen 操作的速度显著提高。
  • 为 IndexWriter 增加了接近实时的搜索功能。
  • 新的 Query 类型。
  • 更智能,伸缩性更强的多词(multi-term)查询(如 Wildcard,Range 等等)。
  • 最新优化过的 Collector/Scorer API。
  • 新增的 Unicode 支持及字符集(Collation)。
  • 基于 Attribute 的 TokenStream 新 API。
  • 在 contrib 中提供了新的 QueryParser 框架,并替换了核心实现。
  • 在基于字段搜索,或使用自定义的 Collector 的时候可取消 Score 功能,这样可以获得显著的性能提高。
  • 新的分析器(PesianAnalyzer,ArabicAnalyzer 即 SmartChineseAnalyzer)。
  • 为大型文本新增快速向量高亮工具(fast-vector-highlighter)。
  • 对数字字段提供了高性能的查询支持。这些字段使用前缀树的结构进行索引,能直接支持简单而高效的数字范围查询,而不需要在外部对数字进行处理。

虽然 Lucene 团队打算在小版本的更新上做到完整的兼容,但是 Lucene 2.9 在不少方面破坏了这一点,详细信息可参考 Changes 文档中“向前兼容策略的改变(Changes in backwards compatibilit policy)”一节。Lucene 团队建议不要直接替换生产环境下的二进制包,而是在部署前重新编译应用程序,以便在出现兼容问题时获得提示并进行修补。

2009-09-27 04:252699
用户头像

发布了 157 篇内容, 共 54.9 次阅读, 收获喜欢 6 次。

关注

评论

发布
暂无评论
发现更多内容

计算机网络基础(六)---网络层-网络地址转换NAT技术

书旅

laravel 计算机网络 网络协议 计算机基础 NAT

redis系列之——事物及乐观锁

诸葛小猿

redis 乐观锁 事物 原子性 隔离性

架构师训练营第七周作业

张明森

谈谈你是如何理解JS异步编程的,EventLoop、消息队列都是做什么 ,什么是宏任务,什么是微任务?

GKNick

架构师训练营 - 第 6 周学习总结

红了哟

架构师训练营 - 第 6 周命题作业

红了哟

web 性能压测工具类

jason

我关闭了微信朋友圈广告!

诸葛小猿

广告 微信朋友圈 关闭

Prometheus 删除指定 Metric

耳东@Erdong

Prometheus metrics

Windows Sandbox应用

Dare Devor

容器 Sandbox 虚拟化

架构师训练营第七周学习总结

张明森

道德的神

多选参数

故事

思想无语言边界:以cglib介绍AOP在java的一个实现方式

八苦-瞿昙

随笔 随笔杂谈 aop

关于性能优化的总结

罗亮

Go: 通过例子学习 Map 的设计 — Part I

陈思敏捷

map Go 语言

Java中生成随机数的不同方法

wjchenge

ARTS打卡-07

Geek_yansheng25

JDK1.8新特性(三):Lambda表达式,让你爱不释手

xcbeyond

Lambda 新特性 JDK1.8 JDK1.8新特性

盘点本周区块链国内大事件

CECBC

Golang实现结构体数组按多字段排序

卓丁

多字段排序 结构体多字段排序 Go 语言

用 GitBook 创建一本书

耳东@Erdong

git markdown gitbook

JDK1.8新特性(二):为什么要关注JDK1.8

xcbeyond

新特性 JDK1.8 JDK1.8新特性

架构师训练营第七周作业--web压测工具

CATTY

从推特被黑看安全木桶效应

石君

安全设计 安全事件

架构师课程第七周 作业

杉松壁

多问为什么

声远

技术 沟通 软件开发流程

运行 client-go 测试用例.md

FeiLong

Kubernetes

发布一本用 GitBook 编辑的书

耳东@Erdong

git gitbook

第七章作业

小胖子

Vagrant 创建多台主机

FeiLong

vagrant 虚拟机

罪羊树——暴力也是种优雅

烫烫烫个喵啊

算法 二叉树 替罪羊 平衡二叉树

Lucene 2.9:数字字段支持、新分析器及性能优化_Java_赵劼_InfoQ精选文章