写点什么

Nuxeo 推出 Fise 语义引擎

  • 2010-09-21
  • 本文字数:1432 字

    阅读完需:约 5 分钟

Nuxeo 的员工博客最近介绍了由 NUXEO 贡献的开源 RESTful 语义引擎 Fise (Furtwangen IKS 语义引擎)。Fise 旨在“为开发人员提供一个可重用的 HTTP 语义服务堆栈,以便在 CMS 中添加风行的语义功能”。Fise 是 IKS (交互式知识堆栈)的一部分,IKS 通过提供语义 Web 功能的方式,使 CMS 得到增强。

“语义引擎”采用非结构化的输入(比如文本文件),生成可搜索的目录和索引,并以此作为提取“有意义”的输入信息的手段。举例来说,语义引擎通常可以(通过语言或主题)对文档进行分类;具备推荐标签;还可以提取名称、地点、日期等已知的条目。使用这种分类信息,引擎还能对文档进行排序、链接到相关文档,也可以进行断言(例如,“X 公司于某日以多少钱收购了 Y 公司”)。内容管理系统涉及的主要内容是文本的创建、持久化和组织(大多数情况是多媒体文本),所以集成语义引擎能给内容的搜索和组织带来明显的优势。内容管理系统主要设计用来记录企业内部生成、使用的文档,组织、管理构成复杂站点的所有“文档”(网 页)。要为每个网页创建“语义 Web”,需要做的一件事就是将语义引擎生成的分类、索引数据纳入进来。

Open Calais Zemanta Evri 都是语义引擎的范例,它们都能通过 Web API 使用,可用来对网页和网站进行语义标注。此类语义引擎的鼻祖是 IZE ,早在 1988 年,IZE 就由坐落在威斯康星州麦迪逊市的小公司 Persoft 开发并销售了。

Olivier Grisel 是 Nuxeo 博客的作者,他总结了语义标注出现的根本原因:

对大部分内容驱动的应用(比如在线网站)或私有局域网来说,将内容条目链接到开放通用数据库(像 DBpedia、Freebase、NY Times 数据库)中定义的语义实体和主题,可以分享共有的概念框架、提升可检索性和互操作性。

发布者可以利用该技术建立自动更新的实体中心,把特定语义实体相关的各种资源(文档、日历事件、人物、组织等)聚集起来,特定的语义实体由涵盖所有应用的无歧义通用标识符确定。

Fise 提供三种基本的 HTTP 服务,它们被定义为端点:

Fise 提供引擎、存储、SPARQL 三种 HTTP 端点: - 引擎端点允许用户分析英文文本的内容,不用在服务器上存储任何内容就可以将分析结果发送回去:这是无状态的 HTTP 服务。

  • 存储端点可以进行同样的分析,而且会把结果保存在 Fise 服务器上:这是有状态的 HTTP 服务。然后后续的浏览就可以使用分析结果了。
  • SPARQL 端点提供机器级访问,以执行复杂的图形查询,去查询那些从发送到存储端点的内容条目中提取出来的增强信息。

对那些想手动测试引擎功能、使用浏览器浏览结果的人来说,这些服务可以直接通过“一个 Web 用户界面”访问,“这是个演示模式”。“对于机器(例如 Nuxeo DM、Nuxeo DAM 等第三方的 ECM 应用)来说,使用 Fise 的第二种方式就是 RESTful API,这些机器把 Fise 作为 HTTP 服务来使用,以增强文档内容”。

组织和个人现在都发现,他们正被庞大的信息所淹没,这些信息主要是非结构化的文档;而且他们必须不停地处理这些信息。这就是人们对具备语义引擎增强技术的内容管理系统和 CMS 越来越感兴趣的原因。Nuxeo 本身是 CMS 服务供应商,现在正计划在产品线中集成 Fise。

Fise 目前还是个独立的 HTTP 服务,有基本的 Web 接口,主要用于演示。要让它真正有用,还需要将它和 Nuxeo 平台结合起来,以便 Nuxeo DM、Nuxeo DAM 以及 Nuxeo CMF 的用户能从无缝的语义体验中获益。

你和你的组织将 CMS 利用到何种程度了呢?你发现在内容里添加语义标注有什么好处呢?

查看英文原文: Nuxeo Introduces fise Semantic Engine

2010-09-21 10:531752
用户头像

发布了 151 篇内容, 共 62.8 次阅读, 收获喜欢 18 次。

关注

评论

发布
暂无评论
发现更多内容

HDC 2023 | HarmonyOS应用联运服务,帮助开发者实现全链路经营提效

Geek_2d6073

[腾讯云 Cloud studio 实战训练营] 制作Scrapy Demo爬取起点网月票榜小说数据

ベ布小禅

Zebec 创始人 Sam 对话社区,“Zebec 生态发展”主题 AMA 回顾总结

BlockChain先知

接口测试必备技能-常见接口协议解析

霍格沃兹测试开发学社

向极致体验奔跑,不妥协的星闪与中国科技的少年气

脑极体

通信

【腾讯云Cloud Studio实战训练营】React 快速构建点餐页面

热爱编程的小白白

9. 数据类型 - 列表详解

茶桁

Python

Bito AI: IDEA 代码提效插件

Monin

AI IDEA chrom AIGC 代码提效

Monkey基本参数介绍

霍格沃兹测试开发学社

技术分享 | app自动化测试(Android)--App 控件定位

霍格沃兹测试开发学社

MiniRBT中文小型预训练模型:结合了全词掩码技术和两段式知识蒸馏技术,加快推理速度

汀丶人工智能

人工智能 自然语言处理 nlp 预训练模型 知识蒸馏

程序员如何利用AI加持

Bruce Talk

AI 敏捷开发

HDC.Together 2023高校人才生态论坛成功举办

最新动态

Zebec 创始人 Sam 对话社区,“Zebec 生态发展”主题 AMA 回顾总结

股市老人

纵览 PoseiSwap 经济体系,如何从宏大的叙事中持续捕获价值?

大瞿科技

技术分享 | Appium 用例录制

霍格沃兹测试开发学社

技术分享 | app自动化测试(Android)--元素定位方式与隐式等待

霍格沃兹测试开发学社

VLE基于预训练文本和图像编码器的图像-文本多模态理解模型:支持视觉问答、图文匹配、图片分类、常识推理等

汀丶人工智能

人工智能 自然语言处理 多模态大模型 视觉问答 图文匹配

纵览 PoseiSwap 经济体系,如何从宏大的叙事中持续捕获价值?

小哈区块

技术分享 | App常见bug解析

霍格沃兹测试开发学社

纵览 PoseiSwap 经济体系,如何从宏大的叙事中持续捕获价值?

西柚子

C与C++之间的相互调用及函数区别

芯动大师

在 Go 语言单元测试中如何解决 Redis 存储依赖问题

江湖十年

后端 单元测试 Go 语言 redis'

技术分享 | Appium环境安装与架构介绍

霍格沃兹测试开发学社

纵览 PoseiSwap 经济体系,如何从宏大的叙事中持续捕获价值?

BlockChain先知

纵览 PoseiSwap 经济体系,如何从宏大的叙事中持续捕获价值?

股市老人

2023-08-06:小青蛙住在一条河边, 它想到河对岸的学校去学习 小青蛙打算经过河里 的石头跳到对岸 河里的石头排成了一条直线, 小青蛙每次跳跃必须落在一块石头或者岸上 给定一个长度为n的数组ar

福大大架构师每日一题

福大大架构师每日一题 左神

技术分享 | Spring Boot 异常处理

霍格沃兹测试开发学社

简单好用的ElasticSearch可视化工具:es-client和Head

javalover123

搜索引擎 elasticsearch ELK ES Elastic Search

Nuxeo推出Fise语义引擎_Java_Dave West_InfoQ精选文章