Apache 软件基金会已经选择面向对象的数据技术(Object Oriented Data Technology)架构作为它的顶级项目之一。OODT 最初是由NASA 的喷气推进实验室 Pasadena 创建的,它支持地理上分布式的透明整合、异构计算以及通过元数据中间件实现的数据源。
OODT 试图解决的核心问题来自于科学领域,在其中会产生大量的数据,并且会在位于不同地理位置的数据库中分别存储。当用户需要分析或者检索这些数据的时候,他们就必须利用各种自定义的工具。为了解决那个问题,OODT 提供了对分布式资源的透明访问、数据恢复和查询优化功能以及分布式处理和虚拟存档。这样,使用 OODT 的应用程序就能够以统一的方式处理来自于不同来源的数据。OODT 的实现主要是用 Java 编写的,据它的开发者所说,他们使用 Maven“从而可以让组件的下载和依赖关系自动化。”
OODT 提供了以下主要功能:
- 编目和存档: 这是用于从资源中提取元数据的功能,然后把这些元数据存储在长期的存档中,并且对数据进行设置版本和存取。
- 网格: 这是为了描述像资源这种带有元数据的实体的组件,并且会“以标准的格式获取产品(资源)或者元数据。” 除了 CORBA 和 RMI 之外,OODT 还包含了 WebGrid ,它使用 REST 来提供描述和产品服务。
- 常用: 提供了常用功能——像查询表达式、单点登录——的工具组件,它还提供了杂项 工具,像 IO 流、日志或者 XML 等。
- OODT 的敏捷性: 使用 Python 语言对 Apache OODT 的重新实现,重点在于高性能,以及更快的开发和整合。
根据 ApacheOODT 站点所提到的,解决方案不仅适合于科学计算,而且还提供了一种通用的软件架构,能够用来创建模型以便于处理信息。此外,它引入了对知识搜索的支持,并提供统一的层,从而隐藏数据的异质性、技术和元数据。
2010 年 1 月,JPL 基于 Apache 许可把 OODT 作为孵化项目提交。不管是否有开发者对质量和代码的可用性作出改善,孵化项目都是有效的。仅仅 11 个月之后,OODT 就被提升为 TLP,那意味着 Apache 基金会认为 OODT 是它的技术库的重要组成部分。在这种情况下, Apache HADOOP (为可靠性、可伸缩性和分布式计算提供的开源软件)和 OODT 如何相互实现就会很有趣了。
评论