链接开放数据(Linking Open Data)合作计划已经完成了一个全球性的REST 式SOA 方案,人们可以通过它访问来自大约50 个分布式提供者(如 DBpedia 、 Geonames 、 MusicBrainz 、 WordNet 、 DBLP bibliography 和 2000 U.S. Census 等)的超过 20 亿个相互链接着的断言(RDF 三元组(RDF triples))。所有这些数据都是以 RDF (Resource Description Framework,资源描述框架)格式发布的。各数据集均具有具名图(named graph)的结构,你可以基于普通的 HTTP GET、通过 Cool URI 来访问它(参见之前的文章)。 关于如何参与贡献的具体说明可以参见《How to Publish Linked Data on the Web》这篇文章。因为数据集是在不同来源之间普遍互联着的,所有这一切造就了一个大(即便算不上巨大)的机器可读的(machine readable)Web。 如果提供者还实现了SPARQL 端点(endpoint)的话(可能是用像 D2R Server 这种基于 RDBMS 的工具),客户端就可以针对这些数据使用强大的 RDF 查询语言——SPARQL 。 人类可以利用像 Firefox 插件 Tabulator 这样的 RDF 浏览器来获得体会。关于 LinkedData 的最近一次演讲强调了更复杂的应用模式,比如特定领域的LinkedData mashups、移动地理空间入口点(mobile geospatial entry-points)、语义搜索引擎(semantic search engines)、数据融合(data fusion)、聚合与深化工具(aggregation and drill down tools)等——这些肯定不久就会出现。
然而,目前有一个重大限制:这个帅呆了的网络只能提供只读访问。即将到来的 SPARQL Update 语言将解决这一问题。SPARQL 查询语言自从 2004 年由 W3C RDF 数据访问工作组(Data Access Working Group)开始开发、直至今年一月成为 W3C 推荐标准(Recommendation )以来, 有几个问题就一直没有得到解决,比如聚集函数(aggregate functions)和更新语言(update language)等。Andy Seaborne(知名的 Jena 开发者)和 Geetha Manjunath(二位均来自惠普公司)最近发布了 RDF 图更新语言 SPARQL/Update (亦被称作“SPARUL”)的第五版,这可以推进这一问题。该语言拟提供以下功能:
* 往 RDF 图中插入新的三元组。
\* 从 RDF 图中删除三元组。
\* 以单个动作的粒度来执行一组更新操作。
\* 在图库中创建新的 RDF 图。
\* 从图库中删除 RDF 图。
这比较像链接数据(Linked Data)的 PUT、POST、DELETE 实现(implementation)。但什么是图库(Graph Store)呢?图库就是“在单个服务管理下的一个 RDF 图仓库(repository )”,其作用是作为发布 SPARQL 表达式的端点(endpoint)。要知道,每个图都是一个“应由 URI 本身表示的”RDF 数据集——那么为何不直接向那个“Cool URI”发送 HTTP POST/PUT/DELETE 呢?
惠普公司的 SPARQL Update 草案既没有提出、也没有回答这一问题,但 SPARQL Update Wiki 在其 Q&A 部分给出了一些提示:
SPARQL 是只读的,所以可将它映射为 URIs(因此采用 GET)而不会违反 Web 架构的太多原则。
REST 风格的 HTTP 操作应该可以在添加、更新、删除具名图(named graphs)的操作中起更重要的作用。
虽然 PUT 和 POST 通常比较有用,但 REST 和 Web 架构没有阻止使用其他方法——那也许更有助于实现“对大图进行原子更新”。
请尽量避免重蹈 Web 服务的覆辙;应用协议不是用于“被绑定的”,因为那会掩盖其大部分价值。
RDF 和 REST 的资源(resources)概念是可以不一样的。从 2006 年的《the trouble with “binding”》和《REST without RDF is only half as bad as SOAP》,直到今年二月的《Bridging the semantic Web and Web 2.0 with REST》,一直在讨论这一问题,不过尚未得出任何定论。为什么这很重要?
链接开放数据(Linking Open Data )的REST 式Web 为REST 式SOA 树立了一个出色的真实世界模式——在仅提供只读访问时。设想一下,企业以同样的方式在内部容易地发布它们的数据;那么跨企业的机构也同样可以做到(假定安全需求同样得到满足的话)。至于链接开放数据(Linking Open Data)里的UPDATE,这很可能将用SPARQL Update 来实现。虽然这是一个语言,而不是一个应用协议,但它基于了对这样一个协议的假设,即标识图库(Graph Store)而不是图(Graph)。所以,“避免重蹈Web 服务的覆辙”也许是值得的。
查看英文原文: SPARQL Update to Complete RESTful SOA Scenario - - - - - -
译者简介:徐涵,中文 W3C 技术推广网站 W3China(w3china.org)创始人,开放翻译计划(transwiki.org)发起人,W3C 特邀专家。2005 年毕业于东南大学,获计算机硕士学位。2003 年创办中文 W3C 技术推广网站 W3China(w3china.org),2004 年发起开放翻译计划(transwiki.org)致力于 W3C 技术文档的翻译,2006 年翻译出版国内首本中文 SOA 专著《Understanding SOA with Web Services 中文版》(荣获 2006 年度 CSDN 读书频道 SOA 先锋奖,入选 China-pub 2006 年度好书榜),2008 年翻译出版 REST 专著《RESTful Web Services 中文版》。研究兴趣包括:Web Architecture、Semantic Web、Web Services、SOA、Social Network 等。联系方式: hanxu@w3china.org 。参与 InfoQ 中文站内容建设,请邮件至 editors@cn.infoq.com 。
评论