Apache 软件基金会近日正式发布了 Lucene 4.9 版本。由于老的 JDK 版本的一些 JVM bug 会影响到 Lucene,所以新版本的 Lucene 不再支持 JDK 7u55 以下的 Java 版本,且版本全面兼容 Java 8。
Lucene 4.9 版本包括大量的 bug 修复、优化和改进,现已提供下载( Lucene 4.9 更新文档)。主要改进包括:
- 一组 doc 值字段的原子更新(Atomic update)
- 针对 doc 值搜索性能的大量优化
- 新增了 Terms.getMin/Max 方法,用于检索每个字段中使用率最高和最低的项(term)
- 新增了 IDVersionPostingsFormat 方法,优化了主键 ID filed,也为每个 id 记录了一个 long 型的版本值,优化了 ID 查找功能
- 新的(默认的)Lucene49NormsFormat 方法,可以在某些情况下(比如超短字段)实现更好的压缩
- 新的 SORTED_NUMERIC 文档值类型,可以更有效地处理多个值的数字字段
- 索引现在可以传递早期的令牌流,使得重用更容易
- MoreLikeThis 可以接受每个字段中的多个值,pre-existing 方法已经不再鼓励使用
- Lucene 文件现在通过 OutputStream 编写,完全禁止通过简化的 IO API 进行搜索
Apache Lucene 是一个使用 Java 开发的高性能的全文检索引擎,读者可以从这里下载最新版本的 Lucene , 详细的改进说明可以阅读 Lucene ChangeLog 。此外,基于 Lucene 的 Solr 也更新到了 4.9 版本,Solr 4.9 中除了包含 Lucene 4.9 的改进外,还针对企业搜索应用进行了优化和改进,读者可以到其官网了解相关信息。
评论