写点什么

LinkedIn 已将可自定义的索引引擎 IndexTank 开源

  • 2012-01-04
  • 本文字数:701 字

    阅读完需:约 2 分钟

LinkedIn 已将 IndexTank 开源,这是一种运行在云中的文档索引引擎,它让用户可以自定义编制索引的过程,并对结果进行微调。

IndexTank 是在一年之前发布的,在十月份被LinkedIn 收购,并在最近开放了源代码。IndexTank 是与 Google 自定义搜索类似的云服务,它基于 Amazon Web Services 运行,给网站提供了为其中的内容编制索引的功能,而网站的访问者会在稍后搜索这些内容。IndexTank 声称他们的用户拥有完全的控制权,可以决定对什么编制索引,何时编制索引,以及如何对结果排序。这意味着网站可以在搜索结果的基础之上,对想要优先显示的文档做出改善,而不需要依赖于Google 的搜索算法。

和很多站点不同,IndexTank 不会爬取网页的内容,从而对其建立索引,而是会由站点向索引引擎发送要索引的数据。这样,文档在创建之后就可以索引到,这提供了实时的结果。另外,我们可以免费添加这项服务。

IndexTank 包括三个主要组件:

  • 索引引擎——只对简单文本建立索引的引擎。而 PDF、微软文档以及其他文档类型需要在建立索引之前转换为文本格式。
  • API ——可以通过 Java、Python、.NET、Ruby 和 PHP 客户端访问的 RESTful 的接口。
  • Nebulizer ——一种多租户框架,其中存放不限数量、运行在 IaaS 基础架构上的索引引擎。

IndexTank 加入了 Zoie ,那是一种基于 Apache Lucene 构建的实时搜索引擎,并由 LinkedIn 于 2008 年开源。

IndexTank 声称他们已经在一年间吸引了成千上万的用户,其中最值得关注的就是 Reddit ,但这家公司在被 LinkedIn 收购的时候还没有盈利。

IndexTank 的源代码可以在 GitHub: Index Engine API plus Nebulizer 处下载。

查看英文原文: LinkedIn Open Sources IndexTank, a Customizable Indexing Engine

2012-01-04 07:232906
用户头像

发布了 340 篇内容, 共 129.0 次阅读, 收获喜欢 13 次。

关注

评论

发布
暂无评论
发现更多内容

JUC整理笔记三之测试工具jcstress

JFound

Java

在 Go 中使用并发编程 - 第二部分

TuringTuring

并发编程 协程 线程模型 Go 语言

OBS推流学习笔记

IT蜗壳-Tango

直播 OBS 推流 B站直播

2020全球首创币期权DAPP智能合约强势来袭,闪耀数字经济

极客编

Java 异步编程:从 Future 到 Loom

理帆

Java 并发编程 kotlin Netty

RocketMQ - 如何实现顺序消息

Java收录阁

RocketMQ

Windows10 如何正确修改本地用户的名称及目录

Geek_3gb7ez

windows Windows 10 电脑故障 Windows技巧

使用 Python 和 SudachiPy 进行日语分词

Roc

Python 日语 分词

微信推文无缝滚动是这样炼成的

Geek_3gb7ez

微信 大前端 微信公众号 微信推文 图文混排

写给产品经理的信(4):你一定要做产品经理么?

punkboy

生涯规划 产品 程序人生 产品经理 职业规划

财富的大门给我开了一条缝

YoungZY

读书笔记 读书

ansible-playbook中when结合tags使用,实现变量控制执行

唯爱

[JVM] String#intern 面试必会

猴哥一一 cium

Java JVM string pool string Java 25 周年

企业也有中年危机?探讨数字化与永续经营

FinClip

数字化转型 小程序生态

Kubernetes in action 笔记

FeiLong

Kubernetes 容器

Git数据传输模型及常用命令整理

王坤祥

git git flow

使用 Python 分析 Google Calender 日程

Roc

Python 总结 日历

ARTS-weekly-31

落英坠露

ARTS 打卡计划

【译】并不存在的普通用户(面向极端用户的设计)

Yukun

设计思维 可用性

redis数据结构介绍五-第五部分 对象

Nick

redis 源码 数据结构 源码分析 算法

redis数据结构介绍六 快表

Nick

redis 源码 数据结构 源码分析 算法

使用 Markdown 制作五线谱

Roc

GitHub markdown 五线谱

数据与广告系列三:合约广告与与衍生的第三方广告数据监控

黄崇远@数据虫巢

数据挖掘 互联网 广告 移动互联网

阅读对写作的好处

董一凡

写作

KubeFATE 部署多集群联邦学习平台 FATE

亨利笔记

学习 Kubernetes FATE KUBEFATE

平台化服务的基石:用户认证模型设计

孤岛旭日

企业架构 模型 用户权限

教师节H5案例制作思路分享

Geek_3gb7ez

大前端 H5游戏

ARTS week 1

时之虫

ARTS 打卡计划

一个前端的 Windows10 开发环境

Gadzan

大前端 windows Windows Terminal 环境安装 开发工具

redis数据结构介绍四-第四部分 压缩表

Nick

redis 源码 数据结构 源码分析 算法

学慢点儿,想深点儿

熊斌

学习

LinkedIn已将可自定义的索引引擎IndexTank开源_开源_Abel Avram_InfoQ精选文章