面向文档的数据库引擎 MongoDB在3 月16 日发布了1.8 版本。关键的变更包括新增Journaling 日志、提升分片性能以及Shell 的Tab补全。
Journaling 日志通过预写式的 Redo 日志为 MongoDB 增加了额外的可靠性。开启该功能时,变更会先写入 Journaling 日志,定期集中提交(目前是每 100ms 提交一次),然后在真实数据上进行这些变更。如果服务器安全关闭,日志会被清除。在服务器启动时,如果存在 Journaling 日志,则会进行回放。这保证了那些已写入,但在服务器崩溃前还没有回放的日志能在用户连接前被执行。两次提交之间那 100ms 的时间窗口在未来的版本中有望被缩小。
MongoDB 是一种 NoSQL 数据库,不同于 SQL Server 这样的关系型数据库,MongoDB 中数据的基本单位是文档。类似于 JavaScript 对象,文档中包含一系列带有类型的键值对,这些类型可以是字符串、对象、数组、正则表达式和代码。这些文档以BSON 格式存储,根据文档类型被分组到集合(类似于SQL Server 里的表)中。Schema 的设计取决于哪些文档应该有自己的集合,哪些应该被嵌入到其他集合中去。嵌入的文档就像类里的成员对象。在关系型系统中,你会用一张表来存储订单,另一张外键的表来存储订单项。在MongoDB 中,针对同样的场景,推荐的做法是用一个集合来保存订单,每个订单中保存一个订单项的数组,嵌入其中。
水平扩展是通过自动分片来做的,它允许有序的集合数据分布。每个分片都是一组配置成Replica 集的机器,这意味着分片里的每台机器都拥有分片数据的完整拷贝。分片中会自动进行故障转移。MongoDB 会自动将查询引导到合适的分片上,因此应用程序并不需要了解哪个分片持有什么数据元素。新的Replica 集身份认证功能允许Replica 集的成员之间进行自动身份认证,其中使用了密钥文件和 –keyfile 选项。
Covered 索引和 Sparse 索引也是该版本中新增加的特性。Covered 索引允许在索引本身里存储数据,而Sparse 索引则会排除掉不包含索引字段的文档。Covered 索引在查询所请求的全部字段都包含在Covered 索引中时能提升性能,因为不再需要取出完整的文档记录。Sparse 索引在所检索的字段并非经常出现在集合中时能提升性能。目前,Sparse 索引只能有一个字段。
在MongoDB 的工具集中也有一些变化。mongostat 增加了discover 模式(–discover),它会自动从集群的节点中取回统计信息。通过_mongodump –oplog_ 和_mongorestore –oplogReplay_ 提供了高级事务日志转储和恢复功能。
欲更多地了解该版本中的新特性,请查看 MongoDB 1.8 Webinar 。
评论