写点什么

Akka Actor 及其在商业智能数据服务中的应用

  • 2020-10-20
  • 本文字数:16116 字

    阅读完需:约 53 分钟

Akka Actor及其在商业智能数据服务中的应用

eBay 作为一家互联网电商,有海量的商品交易数据和丰富的数据分析及应用场景。其中,服务于商业智能 (BI) 的数据集,往往根据业务部门的需求及数据本身的特点,以结构、半结构化等形式存在于多个分离异构的数据平台。


目前大数据领域已经涌现了众多优秀的大数据查询及计算引擎,针对不同的应用场景各有侧重。但为了向数据科学家、分析师,以及企业决策人员等终端用户提供数据探索和商业智能服务,各数据分析和应用平台往往需要同时对接多个异构的数据平台和查询引擎,构建 7*24 小时在线的即席查询和报表服务。这些面向用户的数据应用,比如交互式的数据查询及探索平台、商业智能 (BI) 产品,以及基于机器学习的分析预测平台等,对后端的数据平台的访问都有共同的需求和相似的特点。


弥合数据平台和数据应用之间的断层,打通端到端(终端用户及应用到数据存储计算引擎)的数据访问、支持源到源(多种分离异构的数据平台)的数据流动、构建跨数据源、跨存储平台的统一的查询计算引擎,提供面向应用的、统一、强大、高效、稳定的快速数据访问服务,是 eBay 数仓部门 Data Service & Solution (DSS) 需要提供给 eBay 数据用户的基础能力。


本文以 eBay 增强商业智能平台 Nous, 以及业务指标异常检测平台(MMD, Moving Metrics Detection)等多个数据产品所使用的快速数据访问服务 DataExpress 为例, 介绍 Actor Model 及其在企业级数据服务中的应用。

PART 01 背景介绍

Nous 是 eBay 内部增强智能分析平台,通过结合元数据管理 (metadata) 及知识图谱 (knowledge graph) 等技术,支持用户自定义业务指标(metric)和分析维度(dimension),并提供基于自然语言处理和属性图的搜索入口,让用户可以轻松整合定制业务报表、进行交互式数据洞察分析。MMD 是一个基于机器学习模型的时间序列异常指标检测系统。


Nous 和 MMD 共享同一套元数据管理、知识图谱等基础组件,都通过 DataExpress 服务统一访问后端多种数据存储和查询引擎,包括 Kylin, SparkSQL, MySQL, ElasticSearch, MongoDB 等,查询类型以时间序列聚合查询为主。不同之处在于,Nous 主要是交互式即席查询,查询并发量较低、对响应速度要求较高;而 MMD 以批量点查为主(即批量地对特定的指标、维度进行时间序列的聚合查询),因而数据查询并发量相对较高,而对响应延时并不像 Nous 那么苛刻。


作为数据查询的通路,很自然地,在 DataExpress 的最初版本中(1.0 版本,下文简称 DE1.0)我们以查询(query)为核心实体,采用了生产者、消费者的数据模型,以及无状态(stateless)的多节点、多流水线并行执行的系统架构,如下图所示。



图 1


DataExpress1.0 节点抓取消息队列中的查询请求,结合 Knowledge Graph (KG) 中存储的元数据,包括数据源(data source)、指标(metric)、维度(dimension)及其关系(relationship)等,解析查询请求、选择最优查询路径、规划查询计划、执行物理查询、返回结果。


该架构模型简单、稳定、高效,但同时也严重制约了 DataExpress 的能力。例如,


1)缺少全局的资源管理及调度能力


像 DataExpress 这种集群服务,很自然地存在全局的资源管理、任务调度、数据共享的需求,但 DataExpress1.0 这种无状态的“伪”分布式系统,刻意回避了这方面的需求及挑战;而通过简单地增加外部服务来协调资源分配、共享集群状态,不但难以满足业务需求,反而不必要地增加系统开发和运维的复杂度、降低系统的稳定性和运行效率,得不偿失。


2)限制了查询优化能力


为了提高查询速度,同时降低后端数据平台的访问压力,我们期望针对数据查询的模式及数据平台的特性,采用多种优化手段,例如基于平台和表(table)的实时性能统计的最优查询路径的选择;为每个表创建独立的查询缓存及更新淘汰策略、并保证用户视角的数据的一致性及时效性;为某些访问较慢的表自动创建“半聚合”加速缓存表等等。但多种优化手段都依赖于全局范围的状态收集、任务管理、数据复用,在 DE1.0 目前的架构下都难以较好地实现。


3)限制跨平台联合查询(DAG)


跨平台联合查询,例如把 ElasticSearch 中的数据集与 Spark 平台中的表进行“JOIN”操作,以至更复杂的跨多数据源、多平台类型的探索性联合查询,相应的查询规划(query plan)中的步骤跨越多个平台,涉及多个基础及派生表(base/derived table),执行多种类型的算子和操作,理论上可以形成一个复杂的 Directed Acyclic Graph (DAG)。如何以正确、高效、可扩展、可容错的方式执行这种复杂 DAG,对 DE1.0 提出了巨大的挑战。


4)限制跨平台数据流动


例如为了更好地服务于数据查询应用,可以定义轻量(lightweight)的 ETL 任务流,以构建起跨数据源和数据平台的数据流动及数据加速等,目前 DE1.0 的架构都难以支持。

PART 02 解决方案:Actor Model

类比 Hadoop 以 Map-Reduce 为建模核心、到 Spark 以 Dataset (RDD) 为建模核心的转变,我们也在思考,以查询(query)作为 DataExpress 的核心实体,是否是最优的设计方案?


对 Data Service & Solution (DSS) 部门及 DataExpress 系统来说,我们最核心的资产和工作对象是海量的数据,具体而言就是成千上万的“表”(包括半结构化的数据集),查询不过是对这些“表”的具体应用之一。很自然地,我们考虑以“表”为 DataExpress 的建模核心,并采用了 Actor Model 的编程模型,把每个“表”抽象为一个 actor,在 Akka Actor Toolkit 的基础上,开发了 DataExpress2.0(下文简称 DE2.0)。

2.1 Actor Model

Actor 模型是一种并发编程模型[1]。在这种编程模型下,业务对象被抽象为一个个 actor。每个 actor 有自己的状态(state)、行为(behavior)及消息信箱(mailbox)。Actor 之间仅通过发送消息(message)进行交互(如下图所示,图片来自 Flink 社区[2]),并通过响应消息来改变内部状态,执行任务,对外提供服务。Actor 也可以创建子 actor(child actor),从而形成一个树状结构;而 actor 之间的消息则形成一个网状结构。



图 2


Actor 的 mailbox 可近似认为是一个带某种优先级的 FIFO 队列(故下文以“消息队列”指代),actor 按照某种优先级逐个顺序消费(dequeue)其消息队列中的消息(如下图 3 所示,图片来自 Akka Actor 官方文档[3]),多个 actor 对各自消息队列的处理可以并发执行。


不同于常见的面向过程(Procedure Oriented)和面向对象(Object Oriented)编程模型中的函数调用(function call),以及互斥锁等并发同步机制,由于 actor 之间并不共享内部状态,而仅通过响应消息来改变内部私有状态,且每个 actor 对消息的消费(dequeue)是单线程同步的,因此在 actor 的编程模型下,用户完全不用(显式)加锁,仅通过 Fire-and-Forget 的非阻塞的异步消息通讯机制,即可安全实现异步并发。



图 3


需要强调的是,尽管 actor 对消息队列的消费以及自身状态的更新是单线程同步的,但由于每个 actor 可以任意创建子 actor 或者任务线程(如 Scala 中的 Future)去继续其对消息事件的处理,并在处理结束后通过对父 actor 发送异步消息来汇总处理结果、更新内部状态,因而 actor 模型可以充分利用计算资源,快速开发高性能、高并发的分布式应用。

2.2 Table as an Actor

在 eBay 增强商业智能平台 Nous 中,我们把所有结构、半结构化的数据集(dataset)统称为广义上的“表”(table)。在 DataExpress2.0 中,“表”可以根据血缘(lineage)关系分为两类:


1)用户在统一的元数据管理系统中注册的原始物理表(base table);


2)通过对一张或者多张物理表(或派生表)进行某种转换操作(如用户自定义的 join/union/project 等操作,即 custom query)创建出来的派生表(derived table)。派生表可以是概念上虚拟存在的,也可以物化(materialize)为物理表(由于物化的派生表通常用于数据访问加速,类比 Kylin 中 cube 的概念,Nous 内部也常称之为加速 cube)。


不论是原始表还是派生表,都有一个全局唯一的 table ID.


在 DataExpress2.0 的设计中,我们以 table 为建模的核心,为每个 table 创建一个 table actor,可以近似认为为每个 table 在进程内存中创建一个代理(proxy,如下图所示)。所有对该 table 的访问,都由该 table 在整个 DataExpress2.0 集群中唯一的 table actor 负责处理。我们通过把全局唯一的 table ID 绑定到 table actor,就可以利用 Akka Actor Toolkit 提供的组件,以位置透明(location transparent)的方式向该 table actor 发送消息,而无需关心该 table actor 是否存在、以及具体存在于哪个物理节点。



图 4


这种“唯一代理”的建模方式,为我们追踪数据血缘、“表”粒度监控访问状态、优化查询性能、构建复杂功能,提供了极大的潜力。我们将在下文中结合 Akka Actor Toolkit 的功能特性,予以说明。

PART 03 Akka Actor Toolkit 简介

Akka is a toolkit for building highly concurrent, distributed, and resilient message-driven applications for Java and Scala.


- from Akka official website


Akka 是一套为 JVM 开发的 Actor 模型的开源的库及运行时环境,主要用于开发高并发、高性能、可容错、弹性可扩展的分布式系统。Akka 的核心是其 Actor 模型。


需要强调的是,Akka 是一套工具集、运行时库(runtime & library),并不像 Spring 一样是一个框架(framework),因而 Akka 赋予用户更加充分的架构设计(architecture)的自由,同时也对用户的架构设计能力提出更多挑战。


: Akka Actor 基于同一套 Actor 核心库,提供了多套成熟的 API:从语言的角度看,有 Scala 和 Java API,从类型安全的角度看,有 Classic Actor 和 Typed Actor,其中 Typed Actor 主要针对 Classic Actor 的缺陷、强化了类型安全。本文对 Akka 的概念和功能的介绍对所有 API 都适用,但概念阐述及代码举例时默认以 Classic Actor 及 Scala API 为主[4]。

3.1 Akka Actor

Akka Actor 遵从了 Actor 模型的基本特征,有以下特点:


  • Actor Lifecycle


Actor 的创建和销毁都是非常轻量级的操作,可以根据需要在 JVM 中快速创建或销毁大量的 actor;从 ActorSystem 的根节点出发,任一 actor 通过简单的几个 API 即可创建、管理、使用并销毁新的 actor,即子 actor(child actor)。


但既然我们把 Akka actor 用作“表”(table)在进程内存中的代理(proxy),而物理的表是相对长期存在的,难道我们也需要一直为所有的数据源的所有表在 JVM 中创建并常驻一个 table actor? 这显然不是我们想要的方式。


一种更合理的方式是按需 惰性创建(lazy creation) ,即在用户真正需要访问(查询)这个 table 的时候才为其创建 table actor,并在该 actor 长期无活动的时候自动将其销毁、释放资源。整个过程看似简单,但需要注意处理好一些极端情况(corner case),比如 table actor 在长期没有访问、即将销毁回收的瞬间、再次收到用户的查询请求,这时该如何妥善响应该请求?


对于以上常见需求,Akka 都给我们提供了相应的解决方案,包括 Akka Cluster Sharding, Actor Passivation 等,后面我们再结合使用场景展开介绍。


  • Actor Tree and Supervision Hierarchy


Akka actor 可以创建子 actor (child actor);除顶层根节点外,所有的 Akka actor 都有一个自己的父 actor(parent actor),从而形成一个 actor tree,如下图所示(图片来自 Akka 官方文档[5])。



图 5


Parent actor 负责监控管理 child actor, 并可自定义监控策略(supervision strategy),在 child actor 正常或异常退出的时候,选择适当的应对机制(Resume/Restart/Stop/Escalate 等)。当然,即使不同 actor tree 下的 child actor,也可以互相通信、订阅 actor 退出事件(watch for actor termination)等。


这种层级监控机制,使得整个 actor 系统可以更全面、更方便地捕获并处理异常事件,从而促进整个系统的高容错性。


  • Actor Reference


既然 actor 有 mailbox(消息队列),那自然需要有个地址(address)以便相互通信。所有 Akka actor 都有一个 actor reference,通过这个 actor reference 即可向该 actor 发送消息。


在启用了某些 Akka Actor 组件(即 Akka Cluster)的情况下,actor reference 支持以位置无关(location-transparent)的方式向任意 actor 发送消息,即发送者不需要关心该 actor 实际位置是位于本地 JVM 还是一个远端(remote)节点上,通过该 actor reference 发送消息时,如若跨越 JVM 节点,则 Akka 会自动在节点边界对消息序列化,跨越物理边界把该消息传递到接收方 actor。


  • Message Sending


任何 JVM 对象都可以作为消息发送,只要保证是不可变的(immutable);当然,如果消息发送跨越节点边界,也必须支持可序列化并妥善限定消息长度。Scala case class 对象默认是不可变的(immutable),并且其模式匹配(pattern matching)很适用于消息处理,所以一般推荐用 Scala case class 作为消息对象。


Akka actor 发送消息主要有两种方式[6]:


1)Tell: Fire-And-Forget


这是推荐的方式,异步发送消息,消息发送后即转而进行其他处理,不阻塞等待消息回复。


2)Ask: Send-And-Receive-Future


同样是异步发送消息,但这种方式会返回一个 Scala Future 对象,可用于接收消息回复。


此外,消息也可以被转发(forward),如下图所示。



图 6


  • At-Most-Once Message Delivery


Akka actor 秉承了 Erlang actor 的“Let it crash”(任其崩溃)的哲学,认为在分布式的环境下,脱离具体应用场景,而由 Akka actor 为用户实现可靠的端到端的通信既不现实,也不足取。索性把分布式环境下最基本的问题充分暴露给用户,让用户根据自身需求及场景去取舍、解决。因而,Akka actor 之间的消息发送也采用了“At-Most-Once” (最多一次)的语义,即 Akka 不保证消息一定能被接收方接收并处理;用户需要自己通过确认(ack)、超时(timeout)等机制来解决。


Akka actor 模型实现还有其他许多有趣的特性,篇幅所限,在此不再一一赘述。

3.2 Akka Actor Toolkit

Akka Actor Toolkit 为我们开发高性能分布式应用提供了丰富易用、成熟可靠的组件和工具,并辅以完善的文档和详实的示例[7]。


DataExpress2.0 中使用了其中大量的组件(如图 7 所示),本文仅介绍构建 DataExpress2.0 分布式服务所依赖的几个关键组件。



图 7


  • Akka Cluster


Akka Cluster 基于 gossip 协议实现了集群组网及节点异常检测机制,支持可容错的、去中心化的 Peer-to-Peer 的分布式架构,避免了单点故障(single point of failure)及单点性能瓶颈。


  • Akka Cluster Sharding


顾名思义,Akka Cluster Sharding[8]是一种把集群中众多的 actor 以分片(shard)的方式分布到多个集群节点上的机制。


通常,用户可以为业务领域(domain)的某些实体(entity)抽象出 actor(如 DataExpress2.0 中的 table actor),并为每个实体赋予一个全局唯一的逻辑标识符(logical identifier),作为 entity actor id,然后通过 Akka Cluster Sharding 机制,即可把这些 entity actor 分布到多个集群节点上,且保证在整个集群中为每一个实体仅创建唯一一个 actor。用户可以通过该实体的逻辑标志符(即 actor id)向该 actor 以位置无关(location transparent)的方式发送消息,即用户不需要关心该 entity actor 运行在哪个集群节点,Akka Cluster Sharding(实现上是 ShardRegion actor,即 entity actor 的 parent actor,如图 8 所示)会负责把消息路由到目标节点的目标 actor 上。



图 8


用户甚至不需要关心该 entity actor 是否已经在进程中物理存在;当用户第一次通过该实体的 actor id 向该 entity actor 发送消息时,Akka Cluster Sharding 会自动为该实体实例化 entity actor,即我们前面提及的惰性创建(lazy creation)。


而当该 entity actor 长久没有收到消息时,很自然地,用户期望能够销毁该 entity actor,释放系统资源;但同时,也需要能应对这样的极端情况(corner case), 即在 actor 销毁的过程中再次收到消息。为了避免此时丢失消息,Akka Cluster Sharding 也提供了 idle actor 优雅退出方案,即 Passivation[9]:entity actor 在销毁退出的过程中新收到的消息,会被其 parent actor,即图 8 中的 ShardRegion actor 缓存起来,并在该 entity actor 销毁完成后,重新为其创建一个新的全局唯一的 entity actor(new incarnation),然后将缓存的消息转发给该 entity actor,从而尽量避免消息丢失。


  • Akka Cluster Singleton


Akka Cluster Singleton 是由 Akka Cluster 保证的在整个集群中存在、且唯一存在的某个用于特定职责的 actor,比如整个集群的任务管理、状态监控、资源协调等;根据业务需求,可以定义多个不同类型的 Singleton actor。该功能的正确性依赖于集群成员状态的一致性。


需要注意的是,Cluster Singleton 只保证存在且仅存在一个特定职责的 actor, 但在集群节点故障的情况下(如 Leader 节点故障),该 actor 可能会在 failover 的过程中存在短暂的不可用状态。


  • Split Brain Resolver


Akka 的商业版本中提供了 Split Brain Resolver 实现,其实简单在 github 上搜索一下,即可发现在社区中有多个共享版本的实现[11],通过简单几行配置,即可启用;用户也可以定制开发自己的版本。

PART 04 Akka Actor 在 DataExpress2.0 中的应用

DataExpress2.0 (DE2.0) 构建在 Akka Actor 模型的基础上,并使用了 Akka Actor Toolkit 中的多个组件,包括 Akka Cluster Sharding, Cluster Singleton 及其他辅助设施,模块架构如下图所示。


Akka Cluster 的上述多种功能,都依赖于集群成员状态(membership)的全局一致性,以保证 Leader 节点的唯一性。Akka Cluster 提供了异常节点检测机制,但无法区分节点宕机(machine crash)和网络分裂(network partition),因此 Akka Cluster 用户在处理容错(failover)时,必须要考虑脑裂问题(Split Brain)[10]。


实际上,对脑裂问题并没有一个万能的银弹方案(silver bullet),常用的几个选择包括 Static Quorum, Keep Majoriy, Keep Oldest, Down All 等,用户需要根据自己的应用场景取舍选择。



图 9

4.1 Akka Actor 的应用

在 actor 模型方面,我们为整个系统抽象出了多种 actor,重点是 Request Actor 和 Table Actor。


把每个查询请求(query request)抽象为一个 Request Actor。该 Request Actor 有独立的生命周期,可以跨越任意多个请求-响应周期,因而可完成复杂的处理逻辑及会话。比如在 DE2.0 中,Request Actor 支持轮询及异步回调,请求排队、合并、挂起及恢复等,根据请求参数灵活定制超时时间等。


此外,如前所述,DE2.0 的核心设计是为 table 抽象出 Table Actor:对整个业务领域的每个 table,整个集群中存在唯一一个 Table Actor 用于代理所有对该 table 的操作(proxy)。


其他一些辅助及管理类的对象, 包括 Connection Manager, Lock Manager, Task Scheduler, Table Replicator 等等,也都通过 Akka actor 来实现,并充分利用了 Akka actor 模型带来的便利。


4.2


Akka Cluster Sharding


在我们的元数据管理系统中,每个 table 都有一个全局唯一的 id,我们把该 table id 用作 Table Actor 的 id。我们也为每个用户请求(request)创建一个全局唯一的 request id,同样用作 Request Actor 的 id。


每个 Request/Table Actor 都有一个全局唯一的 id,便可以通过 Akka Cluster Sharding 机制对 actor 进行分区分布,并以位置无关的方式从任意一个集群节点出发,访问到全局唯一的目标 Request/Table Actor。


当前 DE2.0 集群中每个节点都包括 Request Server 及 Query Engine 两层,部署于同一个 Akka JVM 节点(后期可能会分拆)。我们在这两层分别为 Request Actor 及 Table Actor 创建了单独的 Sharding Cluster 实现解耦。通过 request id 及 table id,我们可以在任意节点上接收请求(包括用户查询请求和 table actor 请求),并路由到唯一的目标集群节点上的目标 Request/Table Actor 进行处理。


如前所述,Akka Cluster Sharding 也为我们提供了 actor 惰性创建(lazy creation)及优雅退出(passivation)的方案,从而可以高效利率系统资源。

4.3 Akka Cluster Singleton

DataExpress2.0 使用 Akka Cluster Singleton,用 actor 模型实现了集群唯一的任务调度器、分布式锁、全局限流器等。其中,对于分布式锁和限流器的某些需求,比如请求排队、超时自动解锁、资源召回(recall)、资源剥夺(revoke)等,通过 actor 模型自带的消息队列都可以很方便地实现。


为了避免单点性能瓶颈,DataExpress2.0 只用 Cluster Singleton 实现元数据管理、系统运行监控类任务,并通过多种方式避免单点性能及单点故障对整个集群性能(performance)和可用性(availability)造成的影响,包括简化 singleton actor 主消息处理逻辑(复杂处理逻辑代理给 child actor 及 Scala Future 线程),用户端建立带超时的缓存以减少调用频率,并通过异步消息及时发布缓存更新等。

PART 05 使用 Akka Actor 的优势

从系统架构上看, 使用 Akka Actor Toolkit 打造的 Peer-to-Peer 架构的 DataExpress 服务比较适合我们的应用场景。


整个业务上 table 的数量在数千到上万之间,经常访问的活跃的表(active table)只占其中较小的比例,仅为每个活跃的表创建唯一一个 Table Actor,统一处理所有对该表的请求,并且 actor 本身也是个轻量级、资源效率较高的实体,从而决定了整个 DataExpress2.0 集群只需要数个或十数个节点即可满足业务需求。这种 Peer-to-Peer 的架构通过简单的横向扩缩容(scale out)可以很方便地适应业务的增长,同时高效利用资源。Akka Cluster 和 Akka Singleton 在这种规模较小的集群下可以发挥出较好的性能和稳定性。Actor 模型所推崇的“Let it crash”哲学,也使得 DataExpress 系统可以做到较好的弹性及容错性:面对各种异常事件都能自愈(self-heal)并保持响应(responsive)。


从开发实现来看, 由于每个 actor 都有自己的状态(state)、状态机(behavior)、消息队列(mailbox)、计时调度器(timer & scheduler)等,所以我们可以像开发一个单进程、单线程程序一样围绕每个 actor 进行线性编程,从而降低并发系统的开发难度;同时,如果业务需求导致单个 actor 的状态机变得太过复杂,又可以通过创建子 actor 的方式分解逻辑、降低复杂度。此外,Akka Actor Toolkit 提供了大量成熟可靠、接口一致的组件,使得我们在面对新的挑战时都有快速的解决方案。


从系统性能上看, Akka Actor 的目标之一是支持高性能、高并发的应用。DataExpress2.0 的 Table Actor 通过创建 child actor 以及使用 Scala Future 创建多个任务处理线程的方式,可以极为便捷地实现非阻塞的异步高并发,最大限度挖掘单机计算能力;这也促进了集群规模的缩减,进一步提升了整个系统的稳定性。


从技术赋能上看, 通过 Akka Cluster Sharding,我们为每个 request 及 table 创建了全局唯一的 actor 作为代理,并以位置无关的方式对其访问。这种位置透明及唯一性给我们带来了极大的便利和能力:任一 DataExpress2.0 节点都可以作为用户请求的接入节点,并自动把请求路由到目标 Request Actor。由于对任一 table 的请求都由各自 Table Actor 处理,在此前提上,我们可以在每个 Table Actor 内对收到的查询进行合并优化,对状态进行统计监控,在多个平台间对数据进行调度复制,对查询结果进行缓存重用等等,无所不能。


以查询缓存为例。为了提高查询速度,降低后端数据平台的访问压力,在 DataExpress1.0 的版本中曾经把近期历史查询缓存在外部 Redis 集群中。虽然有一定作用,但也遇到了时效性、一致性、外部依赖等问题,通过 actor 模式都可以较好地解决:


  • 时效性: 每个 Table Actor 有实时的访问统计及查询性能数据,以及各 actor 独立的定时器及调度器,因而可以很便捷地定制自己的缓存淘汰及刷新策略,在数据时效性和查询速度之间达到较好的平衡。

  • 一致性: 简单的缓存方案有可能导致用户视角的数据不一致的问题。比如这么一种场景:用户 A 对某表进行一次查询 query-1, 没有命中 cache,因而从数据源查询;随后用户 A 对该表进行了另外一个查询 query-2,命中了某 cache;但因缓存的时效性问题,该 cache 数据有可能跟 query-1 的查询结果并不一致,给用户造成困惑。如果每个 Table Actor 对各自的 table 层级的缓存及查询统一管理,使用简单的策略,即可避免这种不一致性的情况。

  • 外部依赖: Table Actor 本身是实际访问时按需惰性创建,并支持静默无访问时优雅退出(Passivation[9]),且 DataExpress 这种聚合查询为主的场景下,查询结果数据量并不大,因此完全可以把缓存构建在 DataExpress2.0 内部活跃的 Table Actor 上,而不再使用外部存储,从而减少了对外部服务的依赖性、高效利用内存资源。


再以数据加速为例,同样为了提高查询速度,我们可以通过实时或离线分析,找出查询性能较差的 table 及其查询模式,并在查询性能较好的中间平台上创建副本或者预聚合子集(类比 Kylin 的 cube 的概念,我们内部常称之为加速 cube),统一挂接在源表的 Table Actor 下,结合 Query Parser 对查询语句进行关系代数分析,从而有较高的机会直接从加速表得到查询结果;同时通过 Table Actor 自带的定时器,也可以驱动加速表数据的主动更新。


最后,我们以一个比较复杂的查询场景:跨平台异构数据源的联合查询为例,展示 DataExpress2.0 在使用 actor 模式后展现出的强大能力及潜力。


  • Cross-Platform Query DAG


在 DataExpress2.0 的应用场景中,存在跨平台异构数据源的联合查询,比如 MySQL 中存储的一张用户自定义的维度表与 Spark 平台中的一张事实表进行探索性联合查询。由于平台连通性及数据平台版本兼容性等原因,Spark 并不一定能直接去访问异构数据源,此时,需要 DataExpress2.0 有能力弥合这个断层。


目前大数据领域已经涌现了众多优秀的大数据查询及计算引擎,DataExpress2.0 并没有必要再重新制造一个“轮子”。特别是 eBay 大数据部门在 Spark 的基础上增强定制了一个面向交互式分析的 OLAP 查询引擎(eBay Hermes),且该平台与 eBay 基于 Hadoop 平台的数据仓库已经打通,比较适用于 DataExpress2.0 这种跨平台联合查询场景(“大”表可以直接访问,“小”表需要搬运),因此,DataExpress2.0 依托该 Spark 平台,采用了把异构(小)数据集实时复制到该 Spark 平台,与 Hadoop 平台大表执行联合分析的方案。


如下图所示,用户对一张 Spark 表与 MySQL 表执行一条 SQL JOIN 操作(假定 Spark 平台与 MySQL 平台不能直接连通,这在生产环境下比较常见)。



图 10


DataExpress2.0 通过 Query Parser、Query Planner 将其转换为如下的执行步骤:


1)把 MySQL 表的(小)数据子集复制到 Spark 平台;


2)与 Spark 平台上的(大)表执行 JOIN 操作(eBay 数据仓库已经迁移到 Hadoop/Spark 平台,因而 Spark 表不需要复制)。


如下图所示,实际执行中会为最终 JOIN 的结果在 DataExpress2.0 中创建一个虚拟的派生表(virtual derived table,即下图中的表 T3)及其 Table Actor,并为其派生出一个全局唯一的 table id。Query Planner 把该查询 DAG 转换为表依赖树(table dependency tree, derived from what table with what operation),即该表的血缘(Lineage),包括该表所直接依赖的父表、以及生成该表的操作(通常是 SQL 语句)。


查询引擎(Query Engine)把该 table dependency tree 通过 table id 及 Akka Cluster Sharding 机制发送给根节点派生表的 Table Actor (即下图中的表 T3),派生表的 Table Actor 会解析依赖关系(resolve dependency tree),包括向父 Table Actor(即下图中的表 T2)发送数据调度请求,将示例中 MySQL 表(T2)筛选后(SQL2)的数据子集复制到 Spark 平台,并为其创建复制表(即图 11 中的表 T2’),用于最终在 Spark 平台上执行联合查询。



图 11


由于需要调度的异构数据集往往是维度表或者(半)聚合表, 且原联合查询语句(SQL)经过 Query Planner 优化后,会拆分为多条 SQL, 并执行谓词下推(predicate pushdown)等优化,实际上 DataExpress2.0 需要复制的数据集是在原(小)表上执行一条 SQL 语句之后的结果,因而该数据集规模通常并不大,可以快速调度到 ebay 内部为 OLAP 优化的目标 Spark 平台上去。


此外,通过全局唯一的 Table Actor 代理每个 table 的访问操作,每个 Table Actor 实际上会感知、记录、缓存、重用、甚至自动刷新各自 table 在各个平台上的副本(replica),因而通过重用已有副本的方式,可以大大加速平台间的数据调度。


实际上,考虑到用户经常会对多表的联合查询结果做进一步的钻取分析,有些情况下我们会对原查询语句的查询条件做一些放松调整(如扩大日期范围或增加常用维度),并将查询结果(如下图中的派生表 T3)固化为某个中间平台上的物理表(如 MySQL),加速后续查询;同时支持用户自定义调度刷新策略,周期性地刷新该表。实际上相当于用户快捷地自定义了一个新的 cube(类比 Kylin 中的 cube 概念)。该加速表的 Table Actor 会根据调度策略,自动执行数据刷新操作。


整个 DAG 查询执行及优化的诸多细节中,我们都可以发现 Table Actor 带来的优势。



图 12


下图展示了一个更为复杂的跨平台 DAG 查询。为了验证 DataExpress2.0 的完整的 DAG 的处理能力而刻意编写的一个低效的查询,同时为了增加复杂度,刻意把某些派生表指派到了特定平台,如 T12 指派到了 MySQL 平台,实际中的查询经过 Query Planner 规划后可以大幅优化,并不会出现下图中低效的场景。



图 13


该查询方案主要是增加了多个子查询的共同依赖(如图中的表 T12 被 T1234 及 T125 共同依赖),以及一条子查询中支持多表多平台(如图中的表 T1234 及其 3 个不同平台的父表)。


通过使用全局唯一的 Table Actor 的方案,多表共同依赖的父表(T12)仅需一次查询创建(通过图中 SQL1 操作),子表共享唯一的查询结果;而 DAG 中可以并行执行的查询(如图中 SQL2 及 SQL3)则会被 QueryEngine 很自然地并行调度;从而达到整个 DAG 的执行效率的最优。


跨平台 DAG 查询性能取决于其中执行最慢的操作节点,影响因素包括原表查询、数据复制、执行平台、查询频率、缓存策略等,不好一概而论。在我们实际测试场景中发现,通过异步消息、函数回调等机制串联起来的 DAG 调度效率极高,DAG 本身调度耗时可以忽略不计。


此外,上述方案也有很多优化空间,如中间查询引擎的选择等,篇幅所限,不再赘述。

PART 06 使用 Akka Actor 的经验和建议

在我们使用 Akka Actor 的过程中,面对过诸多新概念、新模式、新选择,也踩过大大小小的一些“坑”,此处摘取几点经验总结,仅供参考。

6.1 Classic Actor vs. Typed Actor

Classic Actor 和 Typed Actor 是基于同一套 Actor 核心的两套 API,两者都已经发布许久。在 Akka 2.5.x 及其之前的版本中,Akka 默认主推 Classic Actor;从 Akka 2.6.0 开始 Akka 主推 Typed Actor。但 Akka 官方对两者都继续完全支持,且可以共同使用。因为 DataExpress2.0 项目启动时 Akka 2.6.0 [12]刚发布不久,出于多种考虑因素,我们继续采用了 Classic Actor。


笔者在使用 Classic Actor 中感受到的一个主要问题,就是类型安全(type-safty)。比如,Classic Actor 的消息处理函数类型定义为:



即可以接收任意类型的消息(Any);具体函数体实现一般通过 Scala case class 类型匹配(pattern matching)转换到具体的消息类型上。这为用户在各种类型的 actor 间收发消息带来了极大的便利,但灵活性是把双刃剑。


有了这种自由,用户很容易滥发消息,就像在电路板中到处“飞线”一样,各 actor 通过各种消息编织在一起,形成消息网,导致消息的来源和目的地都不再清晰、且难以调试及维护。更糟糕的是,由于类型向上转换(具体消息类型 up-casting 到 Any),编译器也无法通过编译期检查帮我们捕捉潜在错误,只能由用户自己去调试;JVM 语言类型系统的优势不能完全发挥。


Typed Actor 最大的改变就是显现强化了 Actor 可以处理的消息类型,从而可以充分发挥类型系统及编译器的优势。但实际使用起来如何,笔者并无深刻的体会。


此外,Typed Actor 本身也有两种风格的使用方式:Functional vs. Object-Oriented Style[13]。函数式风格虽然看起来很优雅,但针对大多数程序员的思维习惯、以及要解决的实际问题是否编程友好,需要大家自己去实践中体会。

6.2 语言的选择:Scala vs. Java

Akka Actor 基于 JVM,支持 Scala 及 Java 两种编程语言。


Actor 之间的交互依赖于消息发送,而不是函数调用;面向对象语言中的关键特性多态(polymorphism)往往基于函数调用,在 actor 的消息的世界里发挥不出太多作用。而函数式编程所推崇的 immutability,特别是 Scala 中的 case class, pattern matching, partial function 等非常适合用来处理消息。


此外,前面已经多次提及,actor 的消息处理线程主要用于处理消息队列、更新自身状态、派送消息和子任务,不适合进行一些计算密集或者 IO 密集型的任务;因此需要把此类任务委派给 child actor 去处理,但更快捷的方式是使用 Scala 的 Future,简单几行代码,即可把繁重的任务丢到一个单独的线程及线程池中去处理,避免阻塞主 actor 对消息的响应;同时 Scala Future 的回调接口又可以跟 actor 的异步消息机制完美结合。


Akka Actor 的优势之一是弹性可容错,而 Scala 支持的函数式编程范式,把单入口、单出口的函数以 streaming 的方式串接起来,对异常的捕捉处理非常友好全面,更强化了系统的正确性和容错性。


总之,不论是从开发效率,还是运行效率来看,Scala 无疑都跟 Actor 模式结合得更好。因此,如果使用 Akka Actor,笔者强烈推荐使用 Scala 编程语言。实际上,Scala 和 Akka Actor 背后的商业公司已合并为一家[14],即 lightbend.com, 可见两者的契合度。


从另一个角度看,如果选择 Scala 都能成为障碍,为什么还要使用 Akka Actor 这种小众的编程模型呢?

6.3 严格限定 Akka Cluster 的边界

由于 Akka Cluster 支持以位置无关的方式跨越节点发送消息,很容易诱导一些用户把 Akka Actor 用作分布式 RPC 通信的基础组件,包括 Spark 也曾经把 Akka Actor 用于实现其 RPC 通信;但由于 Akka Actor 消息的版本间的二进制兼容性差、不可靠的消息传递、消息包大小限制、序列化性能,以及组件依赖等多种因素,Akka Actor 并不适合作为通用 RCP 通信组件来使用[15]。


此外,即便真正适合使用 Akka Actor 模型的场景,用户可能也会为了各 Akka Cluster 间交互方便而直接使用 Actor 消息进行 RPC 通信,无意中模糊了各 Akka Cluster 的范围和边界,从而生硬地拼凑出一个巨大的分布式“怪物”(distributed monolith)。


而且考虑到 Akka Actor 消息在各版本间不保证二进制兼容,通过 Akka Actor 消息在多个服务间进行通信,会导致服务间强耦合,也不符合微服务的模式(anti-pattern)。对于种种弊端,Akka 官方及社区都有一些讨论,因此用户需要谨慎限定 Akka Cluster 的边界[16]。

6.4 重视脑裂问题(Split Brain)

DataExpress2.0 构建在 Akka Cluster 的基础上,包括 Akka Cluster Sharding 及 Cluster Singleton 组件,所有这些都依赖于 cluster membership 的全局一致性。考虑到我们的集群都部署于同一个数据中心,且集群规模不大,脑裂问题出现的概率似乎微乎其微。


但实际使用中发现,如果数据吞吐量较大,特别是多个跨平台的数据调度任务不加限制地并发执行,且在开启了 Akka Cluster Auto-Downing 选项[17]的情况下,由于网络拥塞,很容易导致 gossip 协议通信失败,从而出现集群脑裂。


由于 DataExpress2.0 主要是用于数据读取(以及少量可重入的数据调度任务),因而脑裂问题更多的是影响系统执行效率,而不会导致数据损坏及系统紊乱。但作为一个高可靠、高可用的服务,DataExpress2.0 非常重视脑裂问题,并通过采用社区方案快速解决。用户在使用 Akka Cluster 的时候也应该重视该问题,必要时甚至可以考虑放弃 Akka Cluster Sharding 功能而采用自研方案。

6.5 代码开发中的“小坑”

不论是 Akka Actor,还是 Scala 语言,这些模型或语言不但小众,且都有很多的“语法糖”,使用起来“真香”,但如果没有比较严格的代码规范,很容易写出在新手看来“天书”一样的代码。


此外,Scala 并不是纯函数式编程语言(支持 var 变量),叠加 Scala 的隐式参数(implicit)和 Akka 的“语法糖”,很容易出现莫名其妙的程序错误,在复杂的动态消息网络下进行调试并不容易,比如一个常用的 Akka 消息转发的“语法糖”:



如果仔细看 forward 函数的定义:



这其中包含了类型丢失(up-casting to Any),隐式参数(implicit context)以及变量引用(context.sender()),稍有不慎,就掉进坑里。


但是,一旦趟过重重荆棘,真正掌握了 Akka Actor 使用的“秘诀”,就能发挥其巨大的威力和强大的生产力。

PART 07 写在最后

笔者并不是 Akka Actor 模型的鼓吹者,甚至不是很建议大家在生产环境中使用。


笔者个人非常享受 Akka + Scala 的架构设计和代码开发的过程,但考虑到国内技术生态的现状,无论是 Scala 还是 Akka Actor,相对其他语言和框架来说都比较小众,人才市场上能够熟练掌握两者的人较少,一家成熟的公司采用任何技术栈都必须要考虑团队协作及软件系统长期的开发维护。


此外,并不是所有的场景都适用 Actor 模型。Akka Actor 非常强大,但使用门槛也较高,除非是非常适合 Actor 模型的场景,否则单纯为了追求技术极致、盲目跟风,会给项目引入较大的风险。笔者很认同论坛上某位同学的观点[18]:绝大部分场景下你都不需要 Actor 模型,但是需要这个组合的场景,又会无比契合、绝顶强大。


所以,当你厌倦了啰嗦的语言和死板的框架,当你看了本文的建议、对 Actor 模型蠢蠢欲动的时候,笔者真诚地建议你思考再三,努力说服自己:你的应用场景下是否真的需要 Actor 模型?是否有其他更简单成熟的选择?如果你始终无法说服自己放弃这个想法,那就勇敢地尝试吧!


希望本文能在你实践 Akka Actor 的道路上提供一些参考,少走一些弯路,感谢阅读!


参考文献


  1. Actor model, https://en.wikipedia.org/wiki/Actor_model

  2. Flink Internals: Akka and Actors, https://cwiki.apache.org/confluence/display/FLINK/Akka+and+Actors

  3. How the Actor Model Meets the Needs of Modern, Distributed Systems, https://doc.akka.io/docs/akka/current/typed/guide/actors-intro.html

  4. Classic Actors, https://doc.akka.io/docs/akka/current/actors.html

  5. Actor Architecture, https://doc.akka.io/docs/akka/2.5.31/guide/tutorial_1.html

  6. Interaction Patterns, https://doc.akka.io/docs/akka/current/typed/interaction-patterns.html

  7. Overview of Akka libraries and modules, https://doc.akka.io/docs/akka/current/typed/guide/modules.html

  8. Classic Cluster Sharding, https://doc.akka.io/docs/akka/current/cluster-sharding.html

  9. Passivation, https://doc.akka.io/docs/akka/current/typed/cluster-sharding.html#passivation

  10. Akka Split Brain Resolver, https://doc.akka.io/docs/akka-enhancements/current/split-brain-resolver.html

  11. Akka Cluster Custom Downing, https://github.com/sisioh/akka-cluster-custom-downing

  12. Akka 2.6.0 Released, https://akka.io/blog/news/2019/11/06/akka-2.6.0-released

  13. Typed Actor Style Guide, https://doc.akka.io/docs/akka/current/typed/style-guide.html

  14. Lightbend, https://en.wikipedia.org/wiki/Lightbend

  15. Spark project removed the use of Akka, https://issues.apache.org/jira/browse/SPARK-5293

  16. Choosing Akka Cluster, https://doc.akka.io/docs/akka/current/typed/choosing-cluster.html#microservices

  17. Akka Cluster Auto-Downing Removed, https://doc.akka.io/docs/akka/current/project/migration-guide-2.5.x-2.6.x.html#auto-downing-removed

  18. 为什么 Akka(Actor 模型)在中国不温不火?https://www.zhihu.com/question/279512440


本文转载自公众号 eBay 技术荟(ID:eBayTechRecruiting)。


原文链接


Akka Actor及其在商业智能数据服务中的应用


2020-10-20 10:102883

评论

发布
暂无评论
发现更多内容

Springboot中,如何读取配置文件中的属性

华为云开发者联盟

数据库 springboot 映射 配置文件

SENSORO基于TDengine助力基层政府打造数字化应用标杆

TDengine

数据库 tdengine 开源 物联网

PingCode Wiki 权限设计之ACL

阿杰

权限系统 权限控制 acl 权限设计

一站式交付体验:云效+Kubernetes

阿里云云效

阿里云 Kubernetes 云原生 持续交付 一站式平台

开源最佳实践

LinuxSuRen

开源 最佳实践

美景本天成,妙笔偶得之——“妙笔”是怎样炼成的?

百度大脑

等保级别最高为几级?市面上常见吗?

行云管家

网络安全 等保 等级保护 过等保

百度智能云开物再收“一个奖状”

百度大脑

Linux中Shell重定向

入门小站

Linux

上市商业银行推进智慧银行建设,全方位赋能零售业务数字化转型

易观分析

商业银行 智慧银行

动态加载不适合数组类?那如何动态加载一个数组类?

华为云开发者联盟

Java 数组 动态加载 数组类

在阿里,我们如何管理测试环境

阿里云云效

阿里云 DevOps 云原生 敏捷开发 研发提效

netty系列之:channel,ServerChannel和netty中的实现

程序那些事

Java Netty nio 程序那些事 2月月更

Apsara Stack 技术百科 | 可运营的行业云,让云上资源跑起来

阿里云 科技 混合云

Java培训:封装的含义及实现方式

@零度

JAVA开发 封装

这个Dubbo注册中心扩展,有点意思

捉虫大师

dubbo 注册中心

程序员必知的8个Java开源IDE工具

编程江湖

ide

在线脑图思维导图生成工具

入门小站

工具

大数据培训:Hadoop HDFS 实现原理

@零度

hadoop 大数据开发

你会写java脚本吗?-JShell

蜜糖的代码注释

Java 后端开发 2月月更

前端培训:3 个可能有用JavaScript 类

@零度

JavaScript 前端开发

加入科学计算SIG,挑战最前沿的AI+Science研发与创新

百度大脑

聚焦业务价值:分众传媒在 Serverless 上的探索和实践

Serverless Devs

阿里云 Serverless 运维管理 分众传媒 2月月更

Worktile 权限设计

阿杰

权限控制 rbac 权限设计

天数智芯携手龙蜥社区,以高性能算力助力开源发展

OpenAnolis小助手

Linux 开源 芯片

四款你必须知道的前端开发工具

编程江湖

移动办公时代,政企为何首选私有化的即时通讯平台?

BeeWorks

做好云管理一定要云管平台吗?云管理平台应具备什么功能?

行云管家

云服务 云管平台 云资源 云管理

Client-go源码分析之SharedInformer及实战| 社区征文

雪雷

Kubernetes Informer 新春征文

一文详解Kafka API

华为云开发者联盟

kafka API 拦截器 Consumer API Producer API

虎符交易所Hoo研究院:Open Sea上大火的NFT项目—Azuki

区块链前沿News

NFT Hoo 虎符交易所 Azuki

Akka Actor及其在商业智能数据服务中的应用_大数据_eBay技术荟_InfoQ精选文章