Mike Barlow 编写的《实时大数据分析:新兴架构( Real-Time Big Data Analytics: Emerging Architecture )》白皮书,以大数据分析为主题,还介绍了实时大数据分析(RTBDA)与传统数据分析有何不同。Mike 描述了实时大数据分析框架的 5 个阶段:数据净化、模型开发、验证部署、实时计分和模型刷新。
此外,他还探讨了由 David Smith 提出的四层 RTBDA 技术栈:
- 数据
- 分析
- 集成
- 决策
InfoQ 采访了 Mike,谈到了实时大数据分析的当前状态以及像决策科学(Decision Science)这样的大数据领域的新兴趋势。
InfoQ:你能否定义一下实时大数据分析是什么,它是如何工作的?
Mike:实时大数据是很多技术和技巧的集合。在过去,分析过程需要数月、数日或数小时,而实时大数据分析技术将时间减少到了数分钟、数秒甚至不到一秒。两年前,很多数据分析师认为能在 40 分钟内得到查询结果简直是奇迹了。而在今天,他们可以期望在数毫秒内看到结果。考虑查询、得到结果然后开始实验,这几乎就是思考的速度了。另一方面,对高速交易系统而言,毫秒还是太长了,因为在这样的世界中操作是分解为微妙的。因此术语“实时”对作业的需求和手头的任务有很大依赖。
InfoQ:传统分析与实时大数据分析有何差别?
Mike:传统分析往往是这样的过程,从传统数据仓库中检索出结构化数据,然后利用这些结构化数据生成报表。实时大数据分析又前进了一步,不管销售点是实体商店还是电商网站,它都可以给出能带来业务价值的见解和建议。
InfoQ:在白皮书中,你们谈到了机器开始思考并像人一样做出反应的新纪元,再就是从数据科学向下一逻辑前沿——决策科学的转移。你能否更多地探讨一下这些创新及即将到来的趋势?
Mike:分析正向更快、更自动化、更智能和更为商业友好的趋势发展,这样的分析能够快速给出见解并提供具体的建议,更有可能促进销售并带来更高的利润。
InfoQ:你还谈到了创建分析与使用分析两者是不同的。你能否给个例子来介绍下这两个步骤?
Mike:数据分析师与数据的用户和消费者不同,前者直接与数据打交道,而后者往往更接近公司的实际客户。两者都需要对数据进行可视化和理解的工具,但他们需要的工具又有不同。数据分析师和数据科学家需要数据建模工具。而用户和消费者——不管是推销人员还是营销人员——都需要工具来理解数据有可能如何影响客户行为,以及会给销售带来什么样的结果。
InfoQ:实时大数据分析领域有什么新兴趋势?
Mike:因为分析师和用户 / 消费者也可以分为不同的种类,因此可视化、解释或其他以有意义的方式作用于大数据并带来真正业务价值的工具一定会有很多选择。目前还没有一种通用的解决方案能够用于构造一个实时大数据平台。好的一面就是,很多非常聪明,而且积极性很高的人正在努力开发相关技术和策略,以便将大数据转变为有形的企业资产。拭目以待,这一定会非常精彩!
关于受访人
Mike Barlow是一位备受赞誉的记者、作家和传播策略顾问。自从创办 Cumulus Partners 公司以来,他已经写过了多个行业中的主流组织。Mike 与人合著了《The Executive’s Guide to Enterprise Social Media Strategy (Wiley, 2011)》和《Partnering with the CIO: The Future of IT Sales Seen Through the Eyes of Key Decision Makers (Wiley, 2007)》等作品。
他是一位作家,写了很多文章、报告和白皮书,涉及营销策略、营销自动化、客户智能、企业绩效管理、协作社交网络、云计算和大数据分析等领域。在长期的职业生涯中,Mike 还在一些备受推崇的郊区日报中做过记者和编辑,其中包括《The Journal News》和《Stamford Advocate》。他会定期在《The Los Angeles Times》、《Chicago Tribune》、《Miami Herald》和《Newsday》等主流美国报纸上发表专题报道和专栏。
Mike 毕业于汉密尔顿学院,热爱阅读。他获得过私人飞行执照,还是一名狂热的冰球球迷。Mike 和妻子及两个孩子住在康狄涅格州的费尔菲尔德。
评论