写点什么

Netflix 发布 Genie3

  • 2017-07-16
  • 本文字数:946 字

    阅读完需:约 3 分钟

Genie 是一个分布式的 RESTful 架构的任务编排引擎,用于 Netflix 的数据平台。Genie 有两个主要使用场景:第一个是创建和提交自定义的数据处理任务请求,其次是设置本地环境来开发和测试在 Genie 集群上运行的新应用程序和任务。

Netflix 宣布 Genie3 支持几项新特性,包括对较早的任务执行引擎进行重新设计、增强安全功能、增加依赖关系缓存,同时API 也有更新。

Genie 引擎的早期版本不支持领导选举,导致工作节点不必要地执行相同的任务。现在,通过 Zookeeper 或手动配置属性设置单个节点的 IP 地址即可支持集群领导选举。早期版本中所有任务的单一运行脚本运行时间过长,无法满足安全隔离的要求,并降低了在项目扩张阶段项目维护者引入代码更改时隔离风险的能力。Genie3 引入新的方法,使用改进的数据模型来保证运行时间并实现了配置的模块化、描述性和版本化。

在 Genie3 中,任务由若干抽象过程组成,以确保可扩展性。应用程序的运行时间和可执行命令可以通过其API 进行配置。Genie 独立于特定运行时配置或待处理数据,生成Spark、Hadoop、Pig、Hive、PrestoDB 和Sqoop 等类型的应用程序运行脚本。作为开发人员,本地模式工作流能够为不同运行时生成运行脚本,同时还集成了REPL 和stdout 的底层实现以支持测试和开发。

Genie3 的 API 组件覆盖了 Genie 的全部功能。

集群 API、命令 API、应用 API 和作业 API 提供了操作 Genie3 所需的语义。集群 API 负责管理 Genie 的逻辑 worker 集群,不包括基础架构本身。集群 API 还协助管理集群相关的元数据、启动时 worker 集群的基准状态、可用于集群的命令和基准包的安装。从这一点来看它与 Puppet 或 Chef 类似,只是它专注于 Genie 应用程序命令在运行时所需的工作集群的特定安装包和配置。这样可以使应用程序在启动时更加灵活、不受限制,否则应用程序就需要在启动时下载并安装依赖包。

命令 API 的语义在底层应用程序上运行,并且必须指向特定应用程序,但允许定义自己的启动和运行时配置。

作业 API 允许 Genie 用户调度或执行一组命令,并跟踪有关作业执行状态的数据。Genie3 附带了用于 MySql、PostgreSQL 和 HSQLDB 的 JDBC 驱动程序,用于支持 Genie 及其 API 的存储配置。

Genie 3 还支持基于 OAuth2 X.509 公钥证书。

查看英文原文: Netflix Announces Genie 3

感谢张卫滨对本文的审校。

2017-07-16 18:423192
用户头像
蔡芳芳 InfoQ主编

发布了 802 篇内容, 共 568.2 次阅读, 收获喜欢 2796 次。

关注

评论

发布
暂无评论
发现更多内容

centos7docker安装

happlyfox

Docker 学习 3月日更

NA(Nirvana) Chain主打应用而生NA公链NAC公链

区块链第一资讯

用户路径地图与漏洞模型

思亭

用户路径地图 漏洞模型

Rust从0到1-基础概念-控制流

rust 控制流

kylin基本概念和原理

潮湿了我押韵的心情

区块链推动知识产权数字化,区块链在知识产权中的价值体现

13828808769

区块链+ #区块链#

带你全面认识CMMI V2.0(四)——管理 赋能

IPD产品研发管理

项目管理 CMMI

爱奇艺大数据生态的实时化建设

Apache Flink

flink 实时计算

搭建 Mac 系统下的 C++开发环境

Jack—Li

用户路径地图+漏斗模型总结

mas

API 工具链研发的理论基础 - 流派

李宇飞

工具链 API

Python OpenCV 之像素的加减法,取经之旅第 15 天

梦想橡皮擦

3月日更

SpringCloud技术专题-Hystrix以及FeginClient异常

洛神灬殇

SpringCloud Fegin

AI 事件驱动场景 Serverless 实践

Serverless Devs

Kubernetes 云原生 #Serverless

产品经理训练营第八章作业

新盛

Kubernetes v1.21 新特性预览

倪朋飞

Kubernetes 云原生

架构师:始于理性思考,成于科学实践——郭东白老师分享总结

青春不可负,生活不可欺

成长 架构设计 架构师

「架构师训练营 4 期」 第十二周 - 001&2

凯迪

架构师训练营 4 期

第8周用户路径数据分析作业

skylar

ECMAScript 2018(ES9)新特性简介

程序那些事

JavaScript ecmascript 程序那些事 es9

APP 防重放实现

草原狼

安全 API 防重放

云原生AI成过去式,AI原生的云才是通向未来的“藏宝图”

脑极体

用户路径地图+漏斗模型

mas

面向复杂度架构设计的思考

Simon

架构实战营

如何处理分析Flink作业反压的问题?

华为云开发者联盟

实时计算 DWS Flink作业 反压 Sink

产品经理训练营 Week11 学习心得

Mai

「产品经理训练营0期」第八周作业

🌟

产品 产品经理训练营

BI大数据分析系统开发,助力企业数字化转型

13828808769

区块链 区块链+ #区块链#

C++中结构体的定义

Jack—Li

订单和产品的多对多表关系在crudapi系统零代码实现

crudapi

API crud crudapi 一对多 多对一

Redis 如何应对并发访问

escray

redis 学习 极客时间 3月日更 Redis 核心技术与实战

Netflix发布Genie3_大数据_Dylan Raithel_InfoQ精选文章