Gluster 团队在 2012 年 5 月 31 日发布了 GlusterFS 3.3 。GlusterFS 的上一个稳定版本号是 3.2.6,虽然从版本号上看貌似改进并不大,如果你仔细阅读了 3.3 的新特性列表之后,也许会觉得 GlusterFS 社区的版本号取得太保守了。
作为 Gluster 项目的一部分,GlusterFS 项目在 2005 伊始。2007 年他们发布了第一个稳定的版本——1.2.3。2011 年 10 月 4 日,RedHat 收购了 Gluster 并开始着手开发 3.3.0 版本。同时 RedHat 还宣布了其 RedHat Storage 2.0 产品,其基础就是 GlusterFS。
GlusterFS 是一个开源的(基于 GNU GPLv3 协议)分布式文件系统,用户可以使用多台服务器,并通过以太网或者 Infiniband RDMA 互联从而组成一个 GlusterFS 的集群。GlusterFS 集群对外提供 NFS,CIFS 和 Gluster Native(通过 FUSE 进行挂载)的接口以便用户访问 GlusterFS 的存储池。 
GlusterFS 统一挂载方式(摘自 http://www.gluster.org/about/ )
与 Hadoop HDFS 不同的是:GlusterFS 使用了弹性哈希算法来定位文件存储的位置。 由于使用了弹性哈希算法,GlusterFS 不需要专门的 Meta-Data Server 来保存元数据,因此可以避免因为元数据服务器宕机导致的整个集群不可用。也正是因为不需要元数据服务器,所以 GlusterFS 在多个挂载点同时进行数据读写的时候,其整体性能很突出。
在 GlusterFS 3.3 版本中增加的新功能包括:
- 统一的文件和对象存储:GlusterFS 实现了 OpenStack 里的对象存储 API 提供同步读取和写入文件或对象的数据的访问。
- HDFS 兼容: 使 Hadoop 的管理员在 GlusterFS 的非结构化数据上运行 MapReduce 任务,并可以通过常用的工具和 shell 脚本访问 GlusterFS 上的数据。
- 主动自我修复:GlusterFS 卷可以在宕机恢复之后自动从备份服务器上恢复数据。
- Granular 锁:允许在对大文件的自我修复过程中访问数据,这个功能对于把 GlusterFS 作为虚拟机磁盘镜像存储服务器时及其重要。
- 改进的复制策略:系统在写入数据时,只有当用户指定的备份数量的写入操作都完成时才返回。该功能为用户提供了在数据安全性和性能之间做权衡的能力。
如果想了解更多更详细的信息可以去 GlusterFS 的官方网站: http://www.gluster.org/
感谢郑柯对本文的审校。
给InfoQ 中文站投稿或者参与内容翻译工作,请邮件至 editors@cn.infoq.com 。也欢迎大家通过新浪微博( @InfoQ )或者腾讯微博( @InfoQ )关注我们,并与我们的编辑和其他读者朋友交流。
评论