写点什么

基于 Lucene 的分布式搜索引擎: Elasticsearch 1.3.0 发布

  • 2014-08-04
  • 本文字数:1010 字

    阅读完需:约 3 分钟

ElasticSearch 是一个基于 Lucene 构建的开源、分布式、RESTful 的搜索引擎,且遵守 Apache2 协议。ElasticSearch 还能够用于云计算中,且能够满足实时搜索的需要,具有稳定、可靠、快速、安装使用方便等特点。它支持通过HTTP 使用JSON 进行数据索引,还可以通过集成插件的方式,支持Thrift、Servlet、Memcached、ZeroMQ 等的传输协议。近日, Elasticsearch 1.3.0 版本发布,它是最新的稳定版本,且基于 Lucene 4.9。该版本不仅添加了许多新功能,还提高了安全性、稳定性和性能,同时修复了大量的 bug,建议对索引性能有很高要求的应用进行版本升级。主要改进包括:

  • 默认禁用了 JSONP,提高了安全性
  • 默认启用磁盘空间分配决策者
  • 提高了 StemmerTokenFilter 的性能
  • 移除不必要的中间接口
  • 移除不安全的、非法的内存访问方法
  • 实现了主机的在异步方式下即可更新映射
  • 使用 429 错误码替换 503 的错误码反馈到客户端
  • 新增了 percentiles_rank 聚集
  • 新增了 top_hits 聚集
  • 新增了 Lucene 表达式脚本引擎
  • 新增了对 Groovy 脚本语言支持和 Groovy 沙盒
  • 实现了存储在索引中的搜索模板在搜索时可以被检索和使用
  • 能够运行存储在.scripts 索引中的脚本或者模板
  • Elasticsearch 可以在内存里跟踪最近索引文档的版本,自动清理版本映射
  • Translog 刷新阀值不再由日志的数量控制,而是以日志的字节数量大小控制。
  • 在索引过程中可以自动调整用做索引缓存区的 RAM 数量

由于 Elasticsearch 具有能够实时搜索、开源、稳定、快速、支持分布式等众多优点,所以许多国外著名的公司都在使用 ElasticSearch,如 Github、Mozilla、Sony 等公司,其中我们所熟知的 Github 在 2013 年 1 月升级了他的代码搜索,由 Solr 转为 Elasticsearch。目前它的集群规模为 26 个索引存储节点和 8 个客户端节点(负责处理搜索请求),能够搜索 20TB 的数据,这些数据包括 13 亿的文件和 1300 亿行的代码。

Elasticsearch 1.3.0 发布的同时, Elasticsearch 1.2.3 也发布了,它是 1.2.x 系列版本的一个 bug 修复版本,详细信息参见该版本的发布页面

欲知Elasticsearch 更多相关详细信息,请登录其首页查看。 Elasticsearch 1.3.0 已经提供了 ZIP TAR.GZ DEB RPM 多种格式的下载源,开发者可以根据自己的操作系统选定合适的格式下载。


感谢郭蕾对本文的审校。

给InfoQ 中文站投稿或者参与内容翻译工作,请邮件至 editors@cn.infoq.com 。也欢迎大家通过新浪微博( @InfoQ )或者腾讯微博( @InfoQ )关注我们,并与我们的编辑和其他读者朋友交流。

2014-08-04 01:414388
用户头像

发布了 92 篇内容, 共 48.0 次阅读, 收获喜欢 5 次。

关注

评论

发布
暂无评论
发现更多内容

房价危机:疫情后时代席卷全球的新变局|数据报告

前嗅大数据

数据分析 数据采集 爬虫案例 爬虫工具 房价

秒云荣获四川省创新型中小企业认定

MIAOYUN

创新型中小企业 2022创新型中小企业 四川省创新型中小企业 科技型中小企业

Sentinel Go-毫秒级统计数据结构揭秘

阿里巴巴中间件

Go 阿里云 云原生 Sentienl

Redux与前端表格施展“组合拳”,实现大屏展示应用的交互增强

葡萄城技术团队

软件测试/测试开发 | 一文搞定 Appium 环境配置

测试人

软件测试 自动化测试 测试开发 appium app自动化测试

新一代云原生日志架构 - Loggie的设计与实践

网易数帆

开源 云原生 日志 Loggie 企业号 1 月 PK 榜

AirServer正式版Mac7.2.7屏幕软件下载

茶色酒

AirServer AirServer2023

pip安装更换镜像

Geek_7ubdnf

Python.

为什么 APISIX Ingress 是比 Ingress NGINX 更好的选择?

API7.ai 技术团队

APISIX Ingress Controller Kubernetes Serverless NGINX Ingress Controller

如何通过Java应用程序添加或删除 PDF 中的附件

在下毛毛雨

PDF Java’ 添加注释

云堡垒机优点简单说明-行云管家

行云管家

网络安全 堡垒机 云堡垒机

数据可视化图表系列解析——漏斗图

Data 探险实验室

数据分析 可视化 数据可视化 图表 可视化数据

啥玩意儿?一个计时模块要做2天?

为自己带盐

dotnetcore

TiDB 底层存储结构 LSM 树原理介绍

C++后台开发

数据结构 后端开发 LSM树 TiDB

未来软件开发主流模式——低代码开发

力软低代码开发平台

这可能是Feign调用可重试的最佳方案了

JAVA旭阳

Java spring

2022年个人云盘行业发展分析和厂商实力洞察

易观分析

用户 私有云盘

NFTScan 与 Afflux 孵化器达成战略合作伙伴,共同促进 Web3 生态发展!

NFT Research

NFT

4种LED显示屏箱体连接方式

Dylan

LED LED显示屏 户外LED显示屏

工业5.0:为何是下一个10年的制造业关键性变革方向?

PreMaint

工业4.0 智能制造

I see you!「2022 龙蜥社区优秀贡献者」正式启动

OpenAnolis小助手

开源 龙蜥社区 2022 奖项 优秀贡献者

分布式系统-CAP理论

非晓为骁

分布式系统 CAP理论 分布式理论

数据的不确定性及可视化方法

搞大屏的小北

关于局域网中的攻击溯源问题

郑州埃文科技

IP溯源 局域网

平安健康 Dubbo 3 升级、迁移和验证之路

阿里巴巴中间件

阿里云 云原生 dubbo

Python对txt进行读写操作

Geek_7ubdnf

Python

南京市等级测评机构有哪些?哪里可以查到?

行云管家

南京 等级测评机构

pip安装'torch'出现PackageNotFoundError报错解决办法

Geek_7ubdnf

Python

基于 APISIX 的服务网格方案 Amesh 积极开发中!

API7.ai 技术团队

Service Mesh Service Mesh 服务网格 服务网格 APISIX

软件测试/测试开发丨如何从 0 开始学 Python 自动化测试开发(一)

测试人

Python 软件测试 自动化测试 测试开发

基于Lucene的分布式搜索引擎: Elasticsearch 1.3.0发布_语言 & 开发_李士窑_InfoQ精选文章