Compass 项目是基于 Lucene 的一个开源项目,其主旨在于简化将搜索集成到 Java 应用的过程。最近,该项目发布了 2.0 版本。InfoQ 就此采访了 Compass 的创始人 Shay Banon 以获得关于该版本更多更详尽的信息,并且对 Compass 为 Java 社区所做的贡献进行了一番深入的了解。
Banon 罗列了该版本最主要的几个特性在于:
- 简化 ****O/R 映射(ORM)的集成——所有集成特性,比如实时将 ORM 的变化在搜索索引上生成镜像和完成基于映射(mapping-based)的数据库索等特性,现在可以通过 Hibernate/JPA 的配置文件中的配置属性得以实现。
- 分布式数据网格的集成——该版本目前可以支持与 GigaSpaces 、 Terracotta 和 Coherence 的集成,用于实现 Lucene 索引存储的方法现在被作为数据网格的一部分。此外,通过 Lucene 类库和工具仍然能够透明地使用 Lucene 索引。
- 可搜索数据网格功能——在数据网格上发生的变化会通过对象到搜索引擎的映射(Object to Search Engine mapping)以及与 Coherence CacheStore、GigaSpaces 镜像服务的集成自动在 Lucene 索引上生成镜像。
- 性能优化——Compass 内部的主要强化和 Lucene 2.3 中的优化直接催化了 Compass 性能的提升。
- Compass 1.2 升级简易——主要的 API 仍然保持不变,有所更改的是一些配置和微小的 API 方面的修改,相关的升级文档( upgrade notes )覆盖了这些变化。由于一些内部修改,导致应用需要重新创建索引(reindex),但总体来说,升级过程相当简单。
另外,Compass 新建了一个项目官方网站: http://www.compass-project.org ,在这个网站上,你可以检索到该版本完整的修改列表。
Banon 还描述了 Compass 的核心特性,以及如何将 Compass 与 Solr 、 Nutch 和基础 Lucene 进行对比:
Compass 的核心目标在于将搜索集成到 Java 应用的过程进行简化。Compass 试图在结合搜索引擎工作的时候简化 API。对于习惯了 ORM 类库的开发人员来说,这些 API 应该非常熟悉。Compass 的另一主要特性是,它能够轻松地将 Java 对象模型映射到搜索引擎中,也能够映射另外一些格式,比如像 XML 和 Map 类似的结构。更重要的是,Compass 不仅仅能轻松地映射数据,还能提供应用与 ORM 类库、数据网格等天衣无缝的集成。关于 Lucene,Compass 创建于 Lucene 之上。通过 Compass,你可以得到 Lucene 所有的特性,但 Compass 试图简化其用法,尤其是在一些典型的 Java 应用中。至于 Solr,我猜想它的目标也是为了简化 Lucene,但它采用的方法和 Compass 不同,它将暴露了一个 http 服务用来进行索引和搜索,但是我也听说它的一个“嵌入式”版本也将公布于世。我想最主要的不同点是两者对于如何将搜索集成到应用程序中持有不同的看法。我只想指出的是,在 Compass 上创建一个 http 服务非常简单,已经有很多用户在 Compass 上创建了 http 服务。
当被问到 Compass 的未来计划的时候,Banon 表示 Compass 大部分特性都是由用户需求驱动开发的。潜在的未来动向包括面向一些不同的索引格式(比如 JSON);提供更全面、更多特性的数据网格集成来实现托管的索引和搜索(colocated indexing and searching);以及提供一个 UI 层的搜索集成来创造更好的开箱即用体验。Banon 表示他非常欢迎和期待关于 Compass 的各种反馈和帮助。
查看英文原文: Compass 2.0: Simplification, integration, and performance improvements
评论