写点什么

基于 Lucene 的分布式搜索引擎: Elasticsearch 1.3.0 发布

  • 2014-08-04
  • 本文字数:1010 字

    阅读完需:约 3 分钟

ElasticSearch 是一个基于 Lucene 构建的开源、分布式、RESTful 的搜索引擎,且遵守 Apache2 协议。ElasticSearch 还能够用于云计算中,且能够满足实时搜索的需要,具有稳定、可靠、快速、安装使用方便等特点。它支持通过HTTP 使用JSON 进行数据索引,还可以通过集成插件的方式,支持Thrift、Servlet、Memcached、ZeroMQ 等的传输协议。近日, Elasticsearch 1.3.0 版本发布,它是最新的稳定版本,且基于 Lucene 4.9。该版本不仅添加了许多新功能,还提高了安全性、稳定性和性能,同时修复了大量的 bug,建议对索引性能有很高要求的应用进行版本升级。主要改进包括:

  • 默认禁用了 JSONP,提高了安全性
  • 默认启用磁盘空间分配决策者
  • 提高了 StemmerTokenFilter 的性能
  • 移除不必要的中间接口
  • 移除不安全的、非法的内存访问方法
  • 实现了主机的在异步方式下即可更新映射
  • 使用 429 错误码替换 503 的错误码反馈到客户端
  • 新增了 percentiles_rank 聚集
  • 新增了 top_hits 聚集
  • 新增了 Lucene 表达式脚本引擎
  • 新增了对 Groovy 脚本语言支持和 Groovy 沙盒
  • 实现了存储在索引中的搜索模板在搜索时可以被检索和使用
  • 能够运行存储在.scripts 索引中的脚本或者模板
  • Elasticsearch 可以在内存里跟踪最近索引文档的版本,自动清理版本映射
  • Translog 刷新阀值不再由日志的数量控制,而是以日志的字节数量大小控制。
  • 在索引过程中可以自动调整用做索引缓存区的 RAM 数量

由于 Elasticsearch 具有能够实时搜索、开源、稳定、快速、支持分布式等众多优点,所以许多国外著名的公司都在使用 ElasticSearch,如 Github、Mozilla、Sony 等公司,其中我们所熟知的 Github 在 2013 年 1 月升级了他的代码搜索,由 Solr 转为 Elasticsearch。目前它的集群规模为 26 个索引存储节点和 8 个客户端节点(负责处理搜索请求),能够搜索 20TB 的数据,这些数据包括 13 亿的文件和 1300 亿行的代码。

Elasticsearch 1.3.0 发布的同时, Elasticsearch 1.2.3 也发布了,它是 1.2.x 系列版本的一个 bug 修复版本,详细信息参见该版本的发布页面

欲知Elasticsearch 更多相关详细信息,请登录其首页查看。 Elasticsearch 1.3.0 已经提供了 ZIP TAR.GZ DEB RPM 多种格式的下载源,开发者可以根据自己的操作系统选定合适的格式下载。


感谢郭蕾对本文的审校。

给InfoQ 中文站投稿或者参与内容翻译工作,请邮件至 editors@cn.infoq.com 。也欢迎大家通过新浪微博( @InfoQ )或者腾讯微博( @InfoQ )关注我们,并与我们的编辑和其他读者朋友交流。

2014-08-04 01:414242
用户头像

发布了 92 篇内容, 共 46.3 次阅读, 收获喜欢 5 次。

关注

评论

发布
暂无评论
发现更多内容

软件测试概念与体系

测吧(北京)科技有限公司

测试

Doris 实现原理之高效存取 varchar 字符串

Baidu AICLOUD

大数据

掌握在测试中精确模拟用户行为的艺术:技术和工具

测吧(北京)科技有限公司

测试

程序员对 VSCode 粘性滚动真的不感兴趣吗?

伤感汤姆布利柏

软件测试 | 想做性能测试的你,是否面临以下痛点?

测吧(北京)科技有限公司

测试

软件测试 | 平衡规模:测试中经济有效的硬件和软件解决方案策略

测吧(北京)科技有限公司

测试

软件测试 | 分析和处理海量测试数据集的策略

测吧(北京)科技有限公司

测试

时序数据库 vs 实时数据库,一文搞懂!

Apache IoTDB

软件测试 | 如何找到适合您需求的性能测试工具?

测吧(北京)科技有限公司

测试

软件测试 | 揭秘设计现实负载测试场景的艺术:实用方法详解

测吧(北京)科技有限公司

测试

mac空间不足怎么办 mac内存满了怎么清理

禁止废话

MacBook CleanMyMac X mac‘ 电脑软件 杀毒软件

软件测试 | 为何测试环境难以搭建与维护?

测吧(北京)科技有限公司

测试

服务器成本太高,如何确定有效主机容量,节约成本?

测吧(北京)科技有限公司

测试

软件测试 | 简历投了一大堆,面试机会没几个?

测吧(北京)科技有限公司

测试

云架构系统如何进行大规模性能测试?

测吧(北京)科技有限公司

测试

一键自动化博客发布工具,用过的人都说好(腾讯云篇)

程序那些事

工具 程序那些事 自动发布

软件测试 | 简化测试数据生成和管理的复杂性

测吧(北京)科技有限公司

测试

5款.NET开源、免费、功能强大的图表库

EquatorCoco

.net 图表库

软件测试 | 性能测试优化中无缝跨团队协作的策略

测吧(北京)科技有限公司

测试

SD-WAN怎样提升Microsoft 365用户体验感

Ogcloud

SD-WAN 企业组网 SD-WAN组网 SD-WAN服务商 SDWAN

线程安全使用 HashMap 的四种技巧

不在线第一只蜗牛

安全 线程

关于TypeScript数据类型

高端章鱼哥

软件测试 | 不是已经做了性能测试么,为什么系统一上线就崩溃了?

测吧(北京)科技有限公司

测试

软件测试 | 如何选择适合自己业务需求和技术栈的工具?

测吧(北京)科技有限公司

测试

软件测试 | 如何解读各种性能测试数据和曲线图?

测吧(北京)科技有限公司

测试

程序员都应该了解的7款API接口平台

幂简集成

API API接口平台 API市场

前端性能优化:从系统分析讲到实践策略

秃头小帅oi

基于Lucene的分布式搜索引擎: Elasticsearch 1.3.0发布_语言 & 开发_李士窑_InfoQ精选文章