今天宣布 Apache Sentry 成为新的 Apache 顶级开源项目。Sentry 为 Hadoop 集群元数据和数据存储提供集中、细粒度的访问控制。在 2013 年 8 月 Sentry 成为 Apache 的孵化项目,经过两年半的开发,开发社区增长很快,很多组织为其贡献代码,现已有 50 多个贡献者,其中 31 个成为 committer。
Sentry 是什么?
Hadoop 在文件系统层面有强安全策略,但缺乏对数据和 BI 应用细粒度的权限访问支持。这个问题使得 Hadoop 使用者面临两种抉择:要么暴露全部数据,要么控制所有数据。大部分情况下,用户选择后者,这严重约束 Hadoop 集群上数据的访问。Sentry 提供角色级别的数据权限访问,可以进行细粒度权限划分。例如,在 HIve 和 Impala 中,Sentry 的 SQL 权限控制 select、insert 等语句对服务器、数据库、数据表、视图甚至数据列的访问。
Sentry 新功能
Sentry 对不同的 Hadoop 组件提供了六类对权限访问策略管理:
- Sentry 支持多权限模型,也支持同一个权限控制策略对多哥计算框架和数据目录的访问;
- Sentry 支持 Apache Solr(搜索项目);
- Sentry 支持 SQL 表权限和 HDFS 文件权限同步;
- Sentry 支持数据管理的审计日志;
- Sentry 支持高可用性(HA);
- Sentry 支持不同集群间权限策略的导入和导出;
- Sentry 支持 Apache Kafka,Solr 和 Apache Sqoop。
未来展望
成为 Apache 的顶级项目是一个里程碑阶段,但这也是 Sentry 的另一个起点。下一步,将会关注社区成长和培养 Sentry 周边项目的生态。
- 简化 Sentry 权限部署和管理;
- 扩展对成熟关系型数据库的权限控制支持;
- 支持下一代权限访问控制模型,基于属性的访问控制(ABAC),例如,对标签级别的控制;
- 整合对 Hadoop 其它生态组件对支持,让已存在的权限对其它组件也适用。
原文链接: https://dzone.com/articles/apache-sentry-is-now-a-top-level-project
评论