写点什么

Apache Solr : 基于 Lucene 的可扩展集群搜索服务器

  • 2008-11-13
  • 本文字数:1030 字

    阅读完需:约 3 分钟

Apache Solr 项目,是一款基于 Apache Lucene 的开源企业搜索服务器,最近发布了 1.3 版。InfoQ 采访了 Solr 的创建者 Yonik Seeley ,了解了新版本的更多信息和 Solr 提供给最终用户的功能。

Seeley 首先描述了目标用户:“需要搜索框、分面浏览(导航)或者两者结合的任何人”,Solr 的关键特性包括:

  • 基于标准的开放接口——Solr 搜索服务器支持通过 XML、JSON 和 HTTP 查询和获取结果。
  • 易管理——Solr 可以通过 HTML 页面管理,服务器统计数据以 JMX 输出,Solr 配置通过 XML 完成。
  • 分面浏览——搜索结果自动分类。
  • 突出显示命中词——匹配的字符自动在搜索结果中高亮显示。
  • 可伸缩性——快速增量更新和快照分发 / 复制到其他服务器。
  • 灵活的插件体系——新功能能够以插件的形式方便的添加到 Solr 服务器上。

Seeley 同时谈到了该版本中的主要新功能:

  • 分布式搜索——索引现在可以透明的分割成多个部分,单个 Solr 服务器基于各个配置和模式支持多索引,无须停止 Solr 服务器就可以改动主要的配置。
  • 扩展了查询功能——包含了一个新的 Java 客户端( SolrJ )和若干新功能,例如直接配置对于特定查询哪些文档首先命中、近似命中、搜索过期、记录分面时间和拼写检查
  • 增强了数据导入工具——数据库和其他结构化数据源现在都可以导入、映射和转化。
  • 更多可定制扩展点——存在一个新的更新处理器链,允许在查询时修改和重定向文档;一个搜索组件链修改和添加查询结果、用户查询分析器和插件式功能。
  • 性能增强——显著提高了索引速度,二进制响应格式和快速查询删除功能。

详细的更新日志可以这里获得。

Seeley 谈到了更多 Solr 在伸缩性、功能和实用性方面的细节:

Solr 已经部署过数以百万计容量的文档,如果借助分布式搜索,Solr 应该能够处理数十亿的文档集合。 Solr 基于 Lucene,具有优秀的全文相关性,可以很方便的提供词组接近性增强、近期文档增强、编辑增强和基于数字值的专有函数的定制评分机制。

AOL 正在使用 Solr 增强它的频道功能:音乐、橄榄球运动、食谱、参考中心、房地产和汽车都使用这项技术。Solr 的搜索功能也应用于 Netflix、 Zappos、Gamespot、和 Internet Archive。还有很多大客户我目前还不能透漏。

关于 Solr 的未来计划,Seeley 提到了更多的可扩展性、对大集群更方便的配置和管理、基于区域和实时的搜索、重构以使用 Spring 配置插件。Seeley 同时提供了一个邮件列表,在那里他详细讨论了Solr 未来、特别是2.0 版的计划。

查看英文原文: Apache Solr: Extensible, Clustered Search Server Built on Lucene

2008-11-13 07:278367
用户头像

发布了 501 篇内容, 共 257.5 次阅读, 收获喜欢 61 次。

关注

评论

发布
暂无评论
发现更多内容

InnoSetup制作补丁包替换文件操作

中国好公民st

c++ qt 9月月更

HTML标准解读第一章:HTML、XML、XHTML、SGML究竟有什么区别?

水鱼兄

html 前端 HTML标准

【编程实践】一步步带你从二叉树到实现哈夫曼编码

迷彩

算法 二叉树 9月月更 哈夫曼编码 哈夫曼树

哪些应用适合Docker化改造

阿泽🧸

Docker 9月月更

IntelliJ IDEA远程调试Elasticsearch6.1.2

程序员欣宸

elasticsearch 9月月更

如何用Python代码绘制赏月美景?

芯动大师

中秋节

力扣260 - 只出现一次的数字||| 【哈希映射、异或位运算+分治思想】

Fire_Shield

位运算 哈希表 9月月更

图解Kafka的服务端的网络通信模型

石臻臻的杂货铺

kafka Kafka实战 9月月更

2022-09-10:以下go语言代码输出什么?A:编译错误;B:49.0;C:49。 package main import ( “fmt“ ) func main() { ch

福大大架构师每日一题

golang 福大大 选择题

Web3.0 会长什么样?

掘金安东尼

前端 Web3.0 9月月更

融云 Flutter SDK,跨平台开发的真香之选

融云 RongCloud

flutter 跨平台开发 SDK 教程

一张图告诉你出海服务商怎么选:中国互联网出海服务商生态图谱

易观分析

报告 出海服务商

【云原生 | 从零开始学Docker】二、Docker的常用指令学习以及使用

泡泡

Docker 云计算 云原生 9月月更

【精通内核】Linux内核抢占原理源码解析

小明Java问道之路

cpu Linux内核 中断 9月月更 内核抢占

【好一朵美丽的玫瑰花】(C++代码实现+EasyX图形化界面)

Fire_Shield

计算机视觉 9月月更 EasyX

【精通内核】Linux内核自旋锁实现原理与源码解析

小明Java问道之路

Linux内核 自旋锁 读锁 9月月更 写锁

【JavaWeb】Servlet系列——session会话机制

胖虎不秃头

Web java; 9月月更

【JavaWeb】JSP系列——关于JSP、JSP的基础语法、利用Servlet+JSP改造项目、JSP指令、JSP九大内置对象

胖虎不秃头

Web java; 9月月更

【C语言深度剖析】深入理解C语言中函数的递归算法

Albert Edison

递归 C语言 函数 9月月更

极速导入elasticsearch测试数据

程序员欣宸

elasticsearch 9月月更

C++ 学习 ------cmath 头文件的源码学习 03

桑榆

c++ 源码阅读 9月月更

创立一年就估值5亿美金,这个项目是怎么做到的?

One Block Community

区块链 创业 融资 defi

【C语言】字符函数&字符串函数&内存函数(上)[进阶篇_复习专用]

Dream-Y.ocean

c c++ 9月月更

值得收藏|三种经典的指标监控模型

穿过生命散发芬芳

9月月更 监控指标

高性能使用索引

急需上岸的小谢

9月月更

跟我以前学mybatis

楠羽

mybatis 笔记 9月月更

架构师的十八般武艺:高并发架构

agnostic

高并发

FreeRTOS记录(五、FreeRTOS任务通知)

矜辰所致

FreeRTOS 9月月更 任务通知

【精通内核】Linux内核中断控制原理源码解析

小明Java问道之路

cpu 寄存器 Linux内核 中断 9月月更

【JavaWeb】Servlet系列——Cookie机制、乱码问题总结

胖虎不秃头

Web java; 9月月更

python小知识-日志处理logging

AIWeker

Python python小知识 9月月更

Apache Solr : 基于Lucene的可扩展集群搜索服务器_Java_Ryan Slobojan_InfoQ精选文章