写点什么

Apache Solr : 基于 Lucene 的可扩展集群搜索服务器

  • 2008-11-13
  • 本文字数:1030 字

    阅读完需:约 3 分钟

Apache Solr 项目,是一款基于 Apache Lucene 的开源企业搜索服务器,最近发布了 1.3 版。InfoQ 采访了 Solr 的创建者 Yonik Seeley ,了解了新版本的更多信息和 Solr 提供给最终用户的功能。

Seeley 首先描述了目标用户:“需要搜索框、分面浏览(导航)或者两者结合的任何人”,Solr 的关键特性包括:

  • 基于标准的开放接口——Solr 搜索服务器支持通过 XML、JSON 和 HTTP 查询和获取结果。
  • 易管理——Solr 可以通过 HTML 页面管理,服务器统计数据以 JMX 输出,Solr 配置通过 XML 完成。
  • 分面浏览——搜索结果自动分类。
  • 突出显示命中词——匹配的字符自动在搜索结果中高亮显示。
  • 可伸缩性——快速增量更新和快照分发 / 复制到其他服务器。
  • 灵活的插件体系——新功能能够以插件的形式方便的添加到 Solr 服务器上。

Seeley 同时谈到了该版本中的主要新功能:

  • 分布式搜索——索引现在可以透明的分割成多个部分,单个 Solr 服务器基于各个配置和模式支持多索引,无须停止 Solr 服务器就可以改动主要的配置。
  • 扩展了查询功能——包含了一个新的 Java 客户端( SolrJ )和若干新功能,例如直接配置对于特定查询哪些文档首先命中、近似命中、搜索过期、记录分面时间和拼写检查
  • 增强了数据导入工具——数据库和其他结构化数据源现在都可以导入、映射和转化。
  • 更多可定制扩展点——存在一个新的更新处理器链,允许在查询时修改和重定向文档;一个搜索组件链修改和添加查询结果、用户查询分析器和插件式功能。
  • 性能增强——显著提高了索引速度,二进制响应格式和快速查询删除功能。

详细的更新日志可以这里获得。

Seeley 谈到了更多 Solr 在伸缩性、功能和实用性方面的细节:

Solr 已经部署过数以百万计容量的文档,如果借助分布式搜索,Solr 应该能够处理数十亿的文档集合。 Solr 基于 Lucene,具有优秀的全文相关性,可以很方便的提供词组接近性增强、近期文档增强、编辑增强和基于数字值的专有函数的定制评分机制。

AOL 正在使用 Solr 增强它的频道功能:音乐、橄榄球运动、食谱、参考中心、房地产和汽车都使用这项技术。Solr 的搜索功能也应用于 Netflix、 Zappos、Gamespot、和 Internet Archive。还有很多大客户我目前还不能透漏。

关于 Solr 的未来计划,Seeley 提到了更多的可扩展性、对大集群更方便的配置和管理、基于区域和实时的搜索、重构以使用 Spring 配置插件。Seeley 同时提供了一个邮件列表,在那里他详细讨论了Solr 未来、特别是2.0 版的计划。

查看英文原文: Apache Solr: Extensible, Clustered Search Server Built on Lucene

2008-11-13 07:278449
用户头像

发布了 501 篇内容, 共 261.9 次阅读, 收获喜欢 61 次。

关注

评论

发布
暂无评论
发现更多内容

瓴羊Quick BI拥有可视化大屏功能,精准掌握所有数据内容!

小偏执o

cmp云管平台专业厂商选择技巧看这里!

行云管家

云计算 云服务 云管平台 云计算管理工具

基于 IoT+TSDB+Quick BI 云产品架构的楼宇环境监控实战——实践类

阿里云AIoT

数据库 监控 物联网 传感器 测试技术

Vue虚拟dom是如何被创建的

yyds2026

Vue 前端

2023前端一面vue面试题合集

yyds2026

Vue 前端

高级前端面试题汇总

hellocoder2029

JavaScript 前端

喜讯!华秋电子荣获第六届“蓝点奖”十佳分销商奖

华秋电子

还在苦于提升代码质量?快来试试这个方法

博文视点Broadview

腾讯前端二面常考vue面试题(附答案)

yyds2026

Vue 前端

一文详解ATK Loss论文复现与代码实战

华为云开发者联盟

人工智能 华为云 企业号 2 月 PK 榜 华为云开发者联盟

使用 PGO 优化 Databend 二进制构建

Databend

2023年优质的数据库审计厂商当属行云管家!

行云管家

等保 等级保护 数据库审计

字节前端必会面试题(持续更新中)

Geek_02d948

JavaScript 前端

Nodejs+Redis实现简易消息队列

coder2028

JavaScript 前端

前京东高级副总裁周伯文提前1年布局ChatGPT,现招募多名合伙人

B Impact

20道前端高频面试题(附答案)

Geek_02d948

JavaScript 前端

ChatGPT热度“狂飙”,OceanBase也去找它唠了唠

OceanBase 数据库

数据库 oceanbase

图文实录|澜舟科技合伙人李京梅:基于预训练模型的 AIGC 技术与应用实践

澜舟孟子开源社区

AI NLP 大模型 AIGC

javascript尾递归优化

hellocoder2029

JavaScript 前端

有哪些前端面试题是必须要掌握的

hellocoder2029

JavaScript 前端

腾讯前端必会react面试题合集

xiaofeng

前端 React

webpack模块化的原理

Geek_02d948

JavaScript 前端

webpack实战,手写loader和plugin

Geek_02d948

JavaScript 前端

javascript 高级编程 之 Array 用法总结

hellocoder2029

JavaScript 前端

前端一面常见面试题及答案

coder2028

JavaScript 前端

你要的react+ts最佳实践指南

xiaofeng

前端 React

滴滴前端高频react面试题汇总

xiaofeng

前端 React

Vue组件是怎样挂载的

yyds2026

Vue 前端

助力硬件创新,华秋电子荣获科技创新示范奖

华秋电子

Nodejs相关ORM框架分析

coder2028

JavaScript 前端

国外的SRE都是干啥的?薪资如何?

巴辉特

SRE

Apache Solr : 基于Lucene的可扩展集群搜索服务器_Java_Ryan Slobojan_InfoQ精选文章