写点什么

Hortonworks 进军物联网,发布基于 Apache NiFi 项目的 DataFlow 产品

  • 2015-10-07
  • 本文字数:1157 字

    阅读完需:约 4 分钟

Hortonworks 已经在不知不觉中完成了他们的 DataFlow 平台,这个平台基于 Apache NiFi 项目并准备去解决物联网(IoAT)中的数据处理需求。

Hortonworks 公司在最近的一次研讨会上向石油和天然气行业的客户介绍了其DataFlow (HDF)平台。HDF(Hortonworks Data Flow)平台基于 Apache NiFi 项目,它是一种实时数据流处理 系统,在去年由美国安全局( NSA )开源并进入 Apache 社区,NiFi 初始的项目名称是 Niagarafiles。当 NiFi 项目开源之后,一些早先在 NSA 的开发者们创立了初创公司 Onyara,Onyara 随之继续 NiFi 项目的开发并提供相关的支持。Hortonworks 公司最近收购了 Onyara 并将其开发者整合到自己的团队中。

因为 NiFi 可以对来自多种数据源的流数据进行处理,Hortonworks 认为 HDF 平台非常适合用于物联网 (IoAT) 的数据处理。HDF 中的数据流动可以是多个方向,甚至是点对点的,用户可以同收集到的数据流进行交互,这种交互甚至可以延伸到数据源,比如一些传感器或是设备。按照 Hortonworks 公司的说法,HDF 产品是对 HDP 产品的补充,前者主要处理移动中的数据,而后者基于 Hadoop 技术,主要负责从静止的数据中获取洞察。

NiFi 项目在创建过程中遵循了一些理念:1)精细化管理信息流的能力;2)跟踪数据相关事件和信息的能力,比如数据从哪里来,在路径中发生了什么;3)保证控制和数据面的安全能力。NiFi 的主要特性包括:

  • 有保证的数据交付
  • 支持背压(back-pressure)机制的数据缓冲
  • 有优先级的队列
  • QoS
  • 数据溯源(Data provenance):NiFi 对数据流路径上的每次变化都会保留日志记录,从而保证结果的可追溯,以及数据的恢复、重播、审计和评估。
  • 通过日志记录数据的历史细节
  • 支持交互式命令和控制台,并对系统变化提供可视化的反馈
  • 支持流模板(Flow templates)
  • 支持插入式(Pluggable)/ 多角色(multi-role)的安全机制
  • 支持对数据操作的扩展
  • 支持集群管理

NiFi 并非只能用于物联网,实际上,它可以用于所有种类的实时数据处理,比如预测分析、欺诈检测、大数据注入、资源评估等等。NiFi 项目自身提供了 90 个数据处理器 (data processors),这其中包括了数据的编码、加密、压缩、转换、从数据流创建 Hadoop 的序列文件、同 AWS 交互、发送消息到 Kafka、从 Twitter 上获取消息,以及其它等等。你可以在拖放风格的可视化界面上来配置这些数据处理器,把它们链接到一起,并在它们之间使用背压机制来进行流控。NiFi 还提供了内置的自动扩展、请求复制、负载均衡和故障切换机制。

在 NiFi 的路标中还可以看到以下特性:对流的配置管理做进一步的提升、一个扩展和模板注册表、对Avro 的优先支持、交互式队列管理、多租户的数据流,以及其它。

目前,HDF 已经可以在沙箱式的环境中配合 Apache Ambari 进行测试验证。

查看英文原文: Hortonworks Addresses the IoAT with DataFlow Based on NiFi

2015-10-07 19:006066

评论

发布
暂无评论
发现更多内容

IaaS首席架构师的架构设计思考与实践

华为云开发者联盟

架构 分布式 IaaS 虚拟化 华为云Stack

给弟弟的信第1封|兄弟是父母带给我们最好的礼物

大菠萝

28天写作

小伙伴如何更有效的自学java开发

@零度

JAVA开发 自学java

我的Spring AOP没生效,我该如何排查?

JavaEdge

Spring Framework 签约计划第二季

我的应用 OOM 了,我该做点什么?

JavaEdge

JVM 签约计划第二季

为什么我们需要Pulsar?

博文视点Broadview

【Dart 专题】Factory 工厂构造函数

阿策小和尚

28天写作 0 基础学习 Flutter Android 小菜鸟 12月日更

前端开发怎么学习才能更快的提高学习效率

@零度

大前端

听说过python协程没?听说过 asyncio 库没?都在这一篇博客了

梦想橡皮擦

12月日更

Java本地事务失效了,线上应该如何排查?

JavaEdge

Spring Framework 签约计划第二季

博客?Newsletter?付费订阅?Papyrus 都帮你搞定!

遇见

程序员 博客 Blog newsletter

Go语言学习查缺补漏ing Day2

恒生LIGHT云社区

Go 编程语言

服务器宕机了,除了坐等,我还能做点什么?

JavaEdge

JVM 签约计划第二季

模块五课后作业-设计微博系统中评论架构

断水风春

架构实战营

架构训练营 Week1 作业

红莲疾风

「架构实战营」

react源码解析12.状态更新流程

buchila11

React React Hooks

Git进阶(五):git 分支管理策略

No Silver Bullet

git 学习 12月日更

Prometheus Exporter (十四)MySQL Server Exporter

耳东@Erdong

MySQL Prometheus 28天写作 12月日更

有人问你什么是CAP?你就把这篇文章发给他

李子捌

redis CAP理论 28天写作 12月日更

大厂算法面试之leetcode精讲18.队列

全栈潇晨

算法 LeetCode

面试官:重写 equals 时为什么一定要重写 hashCode?

王磊

react源码解析11.生命周期调用顺序

buchila11

React React Hooks

AOP+MybatisPlus 优化特殊的日志模块

4ye

Java spring 程序员 后端 签约计划第二季

dart系列之:HTML的专属领域,除了javascript之外,dart也可以

程序那些事

flutter dart 程序那些事 12月日更

为什么我们需要Pulsar?

博文视点Broadview

从deadline和被狗追说起(2/28)

赵新龙

28天写作

微信小程序开发:新建文件报错Error:pages/xxx/xxx.json Expecting ’STRING’,’NUMBER’,’NULL’,’TRUE’

三掌柜

28天写作 12月日更

DDD 领域驱动设计落地实践系列:微服务拆分之道

慕枫技术笔记

后端 签约计划第二季

生产环境的线程池出问题了,我到底该如何正确使用线程池?

JavaEdge

Java java 并发 签约计划第二季

大厂算法面试之leetcode精讲17.栈

全栈潇晨

LeetCode 算法面试

架构训练营 - 模块五作业

VegetableBird

架构实战营 架构师实战营 「架构实战营」

Hortonworks进军物联网,发布基于Apache NiFi项目的DataFlow产品_开源_Abel Avram_InfoQ精选文章