写点什么

LinkedIn 已将可自定义的索引引擎 IndexTank 开源

  • 2012-01-04
  • 本文字数:701 字

    阅读完需:约 2 分钟

LinkedIn 已将 IndexTank 开源,这是一种运行在云中的文档索引引擎,它让用户可以自定义编制索引的过程,并对结果进行微调。

IndexTank 是在一年之前发布的,在十月份被LinkedIn 收购,并在最近开放了源代码。IndexTank 是与 Google 自定义搜索类似的云服务,它基于 Amazon Web Services 运行,给网站提供了为其中的内容编制索引的功能,而网站的访问者会在稍后搜索这些内容。IndexTank 声称他们的用户拥有完全的控制权,可以决定对什么编制索引,何时编制索引,以及如何对结果排序。这意味着网站可以在搜索结果的基础之上,对想要优先显示的文档做出改善,而不需要依赖于Google 的搜索算法。

和很多站点不同,IndexTank 不会爬取网页的内容,从而对其建立索引,而是会由站点向索引引擎发送要索引的数据。这样,文档在创建之后就可以索引到,这提供了实时的结果。另外,我们可以免费添加这项服务。

IndexTank 包括三个主要组件:

  • 索引引擎——只对简单文本建立索引的引擎。而 PDF、微软文档以及其他文档类型需要在建立索引之前转换为文本格式。
  • API ——可以通过 Java、Python、.NET、Ruby 和 PHP 客户端访问的 RESTful 的接口。
  • Nebulizer ——一种多租户框架,其中存放不限数量、运行在 IaaS 基础架构上的索引引擎。

IndexTank 加入了 Zoie ,那是一种基于 Apache Lucene 构建的实时搜索引擎,并由 LinkedIn 于 2008 年开源。

IndexTank 声称他们已经在一年间吸引了成千上万的用户,其中最值得关注的就是 Reddit ,但这家公司在被 LinkedIn 收购的时候还没有盈利。

IndexTank 的源代码可以在 GitHub: Index Engine API plus Nebulizer 处下载。

查看英文原文: LinkedIn Open Sources IndexTank, a Customizable Indexing Engine

2012-01-04 07:232961
用户头像

发布了 340 篇内容, 共 131.3 次阅读, 收获喜欢 13 次。

关注

评论

发布
暂无评论
发现更多内容

景区共享电动车合作找厂家要注意什么

共享电单车厂家

共享电动车厂家 校园共享电单车 景区共享电动车 共享电动车合作

分布式场景下,如何对外提供易变的服务,打造可靠的注册中心?

华为云开发者联盟

云计算 后端 华为云 华为云开发者联盟 企业号 5 月 PK 榜

【等保一级】等保一级一般适用于哪些信息系统?

行云管家

等保 等级保护 等保一级

IM开发者的零基础通信技术入门(十二):上网卡顿?网络掉线?一文即懂!

JackJiang

网络编程 即时通讯 IM

美团架构师熬夜整理:Netty权威指南2.0版+英雄传说项目

做梦都在改BUG

Java Netty

路由器的后台管理界面的IP地址为什么都是192.168开头?

wljslmz

网络 三周年连更

深入理解shims-vue.d.ts和declare module

Lee Chen

JavaScript

Istio数据面新模式:Ambient Mesh技术解析

华为云开发者联盟

云原生 后端 华为云 华为云开发者联盟 企业号 5 月 PK 榜

如何利用 AREX 在本地快速复现线上问题

AREX 中文社区

自动化测试 接口测试 代码复现

1分钟学会、3分钟上手、5分钟应用,快速上手责任链框架详解 | 京东云技术团队

京东科技开发者

Netty 京东云 企业号 5 月 PK 榜

去哪儿网企业级监控平台-Watcher

Qunar技术沙龙

去哪儿网 监控平台

完美!华为爆出Redis宝典,原来Redis性能可压榨到极致

做梦都在改BUG

Java 数据库 nosql redis 缓存

手把手教会你 | 网络编程

TiAmo

socket通信 服务器编程 单用户模式

面向万物智联的应用框架的思考和探索(下)

HarmonyOS开发者

HarmonyOS

以最大速度将数据迁移至AWS S3存储

镭速

2023年免费堡垒机排行榜(仅供参考)

行云管家

安全运维 运维安全 免费堡垒机

前端配置化表单组件设计方法 | 京东云技术团队

京东科技开发者

前端 表单设计 配置化 企业号 5 月 PK 榜

【问题排查篇】一次业务问题对 ES 的 cardinality 原理探究 | 京东云技术团队

京东科技开发者

ES 京东云 企业号 5 月 PK 榜

数据导向下制造业的生产效率、交易效率提升办法

镭速

细节爆炸!腾讯用13个案例实战讲明白MySQL,没想到这么全

做梦都在改BUG

Java MySQL 数据库

async/await详解

不叫猫先生

JavaScript async/await 三周年连更

谁说前端已死,低代码没干掉我,chatGPT又如何!| 社区征文

花花

三周年征文

软件测试/测试开发丨Pytest 参数化用例

测试人

软件测试 自动化测试 测试开发 pytest

matlab实现通信原理

袁袁袁袁满

三周年连更

使用MASA全家桶从零开始搭建IoT平台(二)设备注册

MASA技术团队

IoT mqtt

机器人SLAM,三维人工智能的核心技术!

博文视点Broadview

使用 NutUI 搭建「自定义业务风格」的组件库 | 京东云技术团队

京东科技开发者

京东云 企业号 5 月 PK 榜

ShareSDK 钉钉平台注册指南

MobTech袤博科技

GaussDB(DWS)字符串处理函数返回错误结果集排查

华为云开发者联盟

云计算 后端 华为云 华为云开发者联盟 企业号 5 月 PK 榜

字节Java程序性能优化宝典开源,原来这才叫性能优化

做梦都在改BUG

Java 性能优化 性能调优

MySQL一次大量内存消耗的跟踪

GreatSQL

LinkedIn已将可自定义的索引引擎IndexTank开源_开源_Abel Avram_InfoQ精选文章