写点什么

Apache Solr : 基于 Lucene 的可扩展集群搜索服务器

  • 2008-11-13
  • 本文字数:1030 字

    阅读完需:约 3 分钟

Apache Solr 项目,是一款基于 Apache Lucene 的开源企业搜索服务器,最近发布了 1.3 版。InfoQ 采访了 Solr 的创建者 Yonik Seeley ,了解了新版本的更多信息和 Solr 提供给最终用户的功能。

Seeley 首先描述了目标用户:“需要搜索框、分面浏览(导航)或者两者结合的任何人”,Solr 的关键特性包括:

  • 基于标准的开放接口——Solr 搜索服务器支持通过 XML、JSON 和 HTTP 查询和获取结果。
  • 易管理——Solr 可以通过 HTML 页面管理,服务器统计数据以 JMX 输出,Solr 配置通过 XML 完成。
  • 分面浏览——搜索结果自动分类。
  • 突出显示命中词——匹配的字符自动在搜索结果中高亮显示。
  • 可伸缩性——快速增量更新和快照分发 / 复制到其他服务器。
  • 灵活的插件体系——新功能能够以插件的形式方便的添加到 Solr 服务器上。

Seeley 同时谈到了该版本中的主要新功能:

  • 分布式搜索——索引现在可以透明的分割成多个部分,单个 Solr 服务器基于各个配置和模式支持多索引,无须停止 Solr 服务器就可以改动主要的配置。
  • 扩展了查询功能——包含了一个新的 Java 客户端( SolrJ )和若干新功能,例如直接配置对于特定查询哪些文档首先命中、近似命中、搜索过期、记录分面时间和拼写检查
  • 增强了数据导入工具——数据库和其他结构化数据源现在都可以导入、映射和转化。
  • 更多可定制扩展点——存在一个新的更新处理器链,允许在查询时修改和重定向文档;一个搜索组件链修改和添加查询结果、用户查询分析器和插件式功能。
  • 性能增强——显著提高了索引速度,二进制响应格式和快速查询删除功能。

详细的更新日志可以这里获得。

Seeley 谈到了更多 Solr 在伸缩性、功能和实用性方面的细节:

Solr 已经部署过数以百万计容量的文档,如果借助分布式搜索,Solr 应该能够处理数十亿的文档集合。 Solr 基于 Lucene,具有优秀的全文相关性,可以很方便的提供词组接近性增强、近期文档增强、编辑增强和基于数字值的专有函数的定制评分机制。

AOL 正在使用 Solr 增强它的频道功能:音乐、橄榄球运动、食谱、参考中心、房地产和汽车都使用这项技术。Solr 的搜索功能也应用于 Netflix、 Zappos、Gamespot、和 Internet Archive。还有很多大客户我目前还不能透漏。

关于 Solr 的未来计划,Seeley 提到了更多的可扩展性、对大集群更方便的配置和管理、基于区域和实时的搜索、重构以使用 Spring 配置插件。Seeley 同时提供了一个邮件列表,在那里他详细讨论了Solr 未来、特别是2.0 版的计划。

查看英文原文: Apache Solr: Extensible, Clustered Search Server Built on Lucene

2008-11-13 07:278408
用户头像

发布了 501 篇内容, 共 259.7 次阅读, 收获喜欢 61 次。

关注

评论

发布
暂无评论
发现更多内容

赫卡忒的眼眸:微光手机“夜视仪”是怎样炼成的?

脑极体

八、高可用之故障隔离

穿过生命散发芬芳

5月月更 高可用设计

java内存模型之happenbefore原则

急需上岸的小谢

5月月更

【愚公系列】2022年05月 二十三种设计模式(八)-组合模式(Composite Pattern)

愚公搬代码

5月月更

Nacos源码系列—服务端那些事儿

牧小农

源码 nacos

【建议收藏】Mysql知识干货(mysql八股文)汇总

利志分享

面试 面试题 MySQL 数据库 面试问题 MySQL InnoDB

Nginx 的日志

HoneyMoose

在线TSV转HTMLTable工具

入门小站

工具

浅谈Java中的Math.random

工程师日月

java 5月月更

目标检测的算法

恒山其若陋兮

5月月更

C语言_语句与位运算练习

DS小龙哥

5月月更

Hadoop Java api操作hdfs(一)

Emperor_LawD

hadoop 5月月更

模块5 作业

KennyQ

全链路压测(十一):聊聊稳定性预案

老张

性能测试 全链路压测

架构实战营总结

晨亮

「架构实战营」

机器学习:真正的底层是什么?

海拥(haiyong.site)

5月月更

模块五作业

HZ

架构实战营 #架构实战营

在线HTML文本提取URL链接工具

入门小站

工具

复杂任务中,流程的解耦设计

架构 事件驱动 任务管理 异步设计

抖音严打虚假宣传滋补膳食内容广告主:必须严格监管信息流广告

石头IT视角

架构训练营-毕业总结

默光

架构训练营5期

Go Web 编程入门:创建动态 HTML 和文本文件

宇宙之一粟

Web Go 语言 5月月更

集成 ShenYu 网关实现 Dubbo 泛化调用

码农大熊

盘古开发框架 Dubbo网关 泛化调用 ShenYu网关

linux之man命令

入门小站

Bigdata 作业第九周

Pyel

2021 企业架构(EA)状态调查报告

涛哥 数字产品和业务架构

企业架构

模块五:作业

本人法海

「架构实战营」

百万级电商秒杀架构设计

晨亮

「架构实战营」

JAVA为什么需要泛型?

源字节1号

软件开发 后端开发 小程序开发

python使用 pywin32 模块操作 excel,Python 操作 excel 系列之五

梦想橡皮擦

5月月更

面向对象的系统分析

奔向架构师

信息系统 5月月更

Apache Solr : 基于Lucene的可扩展集群搜索服务器_Java_Ryan Slobojan_InfoQ精选文章