Apache Sentry成为新的Apache顶级项目 - InfoQ

企业动态
行业深度
AI&大模型
出海
后端
芯片&算力
架构
大数据
软件工程
云计算
大前端
管理/文化

今天宣布 Apache Sentry 成为新的 Apache 顶级开源项目。Sentry 为 Hadoop 集群元数据和数据存储提供集中、细粒度的访问控制。在 2013 年 8 月 Sentry 成为 Apache 的孵化项目，经过两年半的开发，开发社区增长很快，很多组织为其贡献代码，现已有 50 多个贡献者，其中 31 个成为 committer。

Sentry 是什么？

Hadoop 在文件系统层面有强安全策略，但缺乏对数据和 BI 应用细粒度的权限访问支持。这个问题使得 Hadoop 使用者面临两种抉择：要么暴露全部数据，要么控制所有数据。大部分情况下，用户选择后者，这严重约束 Hadoop 集群上数据的访问。Sentry 提供角色级别的数据权限访问，可以进行细粒度权限划分。例如，在 HIve 和 Impala 中，Sentry 的 SQL 权限控制 select、insert 等语句对服务器、数据库、数据表、视图甚至数据列的访问。

Sentry 新功能

Sentry 对不同的 Hadoop 组件提供了六类对权限访问策略管理：

Sentry 支持多权限模型，也支持同一个权限控制策略对多哥计算框架和数据目录的访问；
Sentry 支持 Apache Solr（搜索项目）；
Sentry 支持 SQL 表权限和 HDFS 文件权限同步；
Sentry 支持数据管理的审计日志；
Sentry 支持高可用性（HA）；
Sentry 支持不同集群间权限策略的导入和导出；
Sentry 支持 Apache Kafka，Solr 和 Apache Sqoop。

未来展望

成为 Apache 的顶级项目是一个里程碑阶段，但这也是 Sentry 的另一个起点。下一步，将会关注社区成长和培养 Sentry 周边项目的生态。

简化 Sentry 权限部署和管理；
扩展对成熟关系型数据库的权限控制支持；
支持下一代权限访问控制模型，基于属性的访问控制（ABAC），例如，对标签级别的控制；
整合对 Hadoop 其它生态组件对支持，让已存在的权限对其它组件也适用。

原文链接： https://dzone.com/articles/apache-sentry-is-now-a-top-level-project