写点什么

LinkedIn 已将可自定义的索引引擎 IndexTank 开源

  • 2012-01-04
  • 本文字数:701 字

    阅读完需:约 2 分钟

LinkedIn 已将 IndexTank 开源,这是一种运行在云中的文档索引引擎,它让用户可以自定义编制索引的过程,并对结果进行微调。

IndexTank 是在一年之前发布的,在十月份被LinkedIn 收购,并在最近开放了源代码。IndexTank 是与 Google 自定义搜索类似的云服务,它基于 Amazon Web Services 运行,给网站提供了为其中的内容编制索引的功能,而网站的访问者会在稍后搜索这些内容。IndexTank 声称他们的用户拥有完全的控制权,可以决定对什么编制索引,何时编制索引,以及如何对结果排序。这意味着网站可以在搜索结果的基础之上,对想要优先显示的文档做出改善,而不需要依赖于Google 的搜索算法。

和很多站点不同,IndexTank 不会爬取网页的内容,从而对其建立索引,而是会由站点向索引引擎发送要索引的数据。这样,文档在创建之后就可以索引到,这提供了实时的结果。另外,我们可以免费添加这项服务。

IndexTank 包括三个主要组件:

  • 索引引擎——只对简单文本建立索引的引擎。而 PDF、微软文档以及其他文档类型需要在建立索引之前转换为文本格式。
  • API ——可以通过 Java、Python、.NET、Ruby 和 PHP 客户端访问的 RESTful 的接口。
  • Nebulizer ——一种多租户框架,其中存放不限数量、运行在 IaaS 基础架构上的索引引擎。

IndexTank 加入了 Zoie ,那是一种基于 Apache Lucene 构建的实时搜索引擎,并由 LinkedIn 于 2008 年开源。

IndexTank 声称他们已经在一年间吸引了成千上万的用户,其中最值得关注的就是 Reddit ,但这家公司在被 LinkedIn 收购的时候还没有盈利。

IndexTank 的源代码可以在 GitHub: Index Engine API plus Nebulizer 处下载。

查看英文原文: LinkedIn Open Sources IndexTank, a Customizable Indexing Engine

2012-01-04 07:233003
用户头像

发布了 340 篇内容, 共 132.9 次阅读, 收获喜欢 13 次。

关注

评论

发布
暂无评论
发现更多内容

聊聊Vuex原理

yyds2026

Vue

我奋斗了 18 年才和你坐在一起喝咖啡

宇宙之一粟

解读Vue3模板编译优化

yyds2026

Vue

如何搭建知识库网页?

Baklib

【直播回顾】OpenHarmony知识赋能第八期:手把手教你实现涂鸦小游戏

OpenHarmony开发者

OpenHarmony

5分钟带您了解DSL、以太网线缆和光纤之间的区别,值得收藏!

wljslmz

dsl 光纤 以太网 10月月更

epoll的实现原理

C++后台开发

数据结构 后台开发 linux开发 epoll C++开发

RocketMQ Streams在云安全及 IoT 场景下的大规模最佳实践

阿里巴巴云原生

阿里云 云原生 Apache RocketMQ

量化自动套利分红机器人系统开发(成熟技术)

开发微hkkf5566

Apache SeaTunnel(Incubating) 2.2.0-beta 版本发布!API 重构,连接器与引擎解偶

Apache SeaTunnel

数据同步 Seatunnel 版本发布 数据集成平台 新版本/特性发布

全彩LED显示屏在单位形象的作用

Dylan

LED显示屏 全彩LED显示屏 led显示屏厂家

企业如何低成本快速搭建团队知识库,实现企业知识管理?

Baklib

Flowable 设置任务处理人的四种方式

江南一点雨

Java springboot flowable JavaEE

快手 RocketMQ 高性能实践

阿里巴巴云原生

阿里云 RocketMQ 云原生

详解webpack构建优化

Geek_02d948

webpack

我对软件工程的理解

老张

软件工程 质量保障

Containerization and Its Benefits - Defining and Exploring

Mahipal_Nehra

container Docker Swarm tools APP开发 web 容器

展示出你的创意,知识库搭建也可以这样玩!

Baklib

MobPush Android常见问题

MobTech袤博科技

android

放弃 SpringCloud Gateway!Apache APISIX 在「还呗」业务中的技术实践

API7.ai 技术团队

spring-cloud SpringCloud Gateway APISIX 网关 开源、

深度探讨react-hooks实现原理

xiaofeng

React

企业级MQTT物联网接入平台EMQX正式上线VMware Marketplace

EMQ映云科技

物联网 IoT emqx 10月月更 VMware Marketplace

Apache RocketMQ 5.0 在Stream场景的存储增强

阿里巴巴云原生

阿里云 云原生 Apache RocketMQ

vue的几个提效技巧

yyds2026

Vue

顶级理解!阿里这份Github星标63.7K的Redis高级笔记简直不要太细

程序知音

Java 数据库 redis 架构 后端技术

NFTScan 是什么?

NFT Research

区块链 NFT 多链 数据基础设施

软件测试 | 测试开发 | 测试过程中遇到的那些奇葩bug

测吧(北京)科技有限公司

测试

如何制作企业在线产品手册?这里有一些简单的方法!

Baklib

强引用、软引用、弱引用、幻象引用的区别

zarmnosaj

10月月更

StoneDB 团队成员与 MySQL 之父 Monty 会面,共话未来数据库形态

StoneDB

MySQL 国产数据库 HTAP StoneDB 10月月更

KunlunBase功能体验范例

KunlunBase昆仑数据库

MySQL 数据库

LinkedIn已将可自定义的索引引擎IndexTank开源_开源_Abel Avram_InfoQ精选文章