快手、孩子王、华为等专家分享大模型在电商运营、母婴消费、翻译等行业场景的实际应用 了解详情
写点什么

Tokutek 发布新版本的 TokuDB 和 TokuMX

  • 2014-11-07
  • 本文字数:1105 字

    阅读完需:约 4 分钟

Tokutek 已经发布了其存储引擎产品的新版本。 TokuDB for MySQL 已经到了 7.5 版本,包含两项重要的性能特性。 TokuMX for MongoDB 已经到了 2.0 版本,包含各种新特性,其中包括其本身性能的提升。

对于简单的 select,TokuDB 先前的版本已经支持行的批量获取。 Rich Prohaska 是 Tokutek 的一名工程师,他解释了这样做的动机:

MySQL 使用 Handler API 从 TokuDB(和其它存储引擎)一次获取一行数据。遗憾的是,就每次 Handler 调用从分形树上获取下一行或上一行数据而言,分形树搜索过于复杂而难以使用。TokuDB 在 Handler 中使用了一个批量获取缓冲区,其中包含了一次分形树搜索的结果。当 MySQL 调用下一个或上一个 TokuDB Handler 而且批量获取缓冲区非空时,就从批量获取缓冲区中弹出一行返回给 MySQL。否则,用一次分形树搜索返回的多行结果填充批次获取缓冲区。

在 TokuDB 7.5 中,该特性经过了扩展,支持更复杂的 select 语句了,包括“INSERT [IGNORE] INTO … SELECT”、“INSERT INTO … ON DUPLICATE KEY UPDATE”、“REPLACE INTO … SELECT”和“CREATE TABLE … SELECT”。

除改进了批量获取特性外,TokuDB 7.5 还引入了执行读取无关复制的功能。Prohaska 是这样阐释该特性的:

当使用基于行的复制时,该行的映像会写入二进制日志,用于写入、删除和更新操作。从节点可以从二进制日志中使用该行映像,从而避免了从表中读取该行。这种读取无关复制的设计可以显著降低从节点的 I/O 负载。

Tokutek 做了一次基准测试,声称使用读取无关复制时性能提升了20 倍。不过,Tokutek 提醒说,在可以使用该项特性前需要首先满足一些条件

TokuMX 2.0 带来了自己的一套广受欢迎的改进。首先是将 Ark 一致性算法用于复制。Ark 算法由 Tokutek 创建,与 MongoDB 的默认算法相比,它可以提供更好的复制保障。尤其是,Ark 可以确保实现了 acknowledged 级别 majority write concern 的写操作将永远不会因为随后的故障回滚。

除了 Ark 算法,TokuMX 2.0 还增加了其它两项重要特性。第一项是,分区集合增加了分片支持。分区集合考虑了数据的范围删除,这在对时间序列数据做时效处理时尤其重要。第二项是,TokuMX 现在支持 MongoDB 2.4 的所有地理索引和查询特性。

最后,TokuMX 2.0 增加了快速更新支持。Tokutek 声称,这带来了10 倍的性能提升。在TokuMX 先前的版本中,更新会执行一个查询读取现有文档,然后更改相关索引。借助快速更新,如果更新没有更改任何索引字段,那么开始时的查询就可以完全避免。

TokuDB 和 TokuMX 基于 Tokutek 的分形树索引技术。TokuDB 遵循GPLv2 许可协议,TokuMX 遵循AGPL 许可协议。

查看英文原文:**** Tokutek Releases New Versions of TokuDB and TokuMX

2014-11-07 02:052863
用户头像

发布了 1008 篇内容, 共 387.6 次阅读, 收获喜欢 344 次。

关注

评论

发布
暂无评论
发现更多内容

启科量子 QuSprout 或将启动开源计划

启科量子开发者官方号

人工智能 框架 算力 超算 #量子计算

Linux系统中CPU占用率较高问题排查思路与解决方法

A-刘晨阳

Linux 运维 cpu 11月月更

质量评估模型助力风险决策水平提升

百度Geek说

机器学习 企业号十月 PK 榜 智能测试 质量评估模型

引迈信息低代码怎么样?靠谱吗?

优秀

低代码 低代码平台

一汽集团数字化转型细节分析:明确如何转型事半功倍

雨果

数字化转型

国产数据库肇始之独具特色的场景需求

亚信AntDB数据库

数据库 AntDB 国产数据库 AntDB数据库

Linux系统保存文件命令的详细介绍

源字节1号

软件开发 前端开发 后端开发 小程序开发

vue实战-深入响应式数据原理

yyds2026

Vue

如何使用ModelBox快速提升AI应用性能

华为云开发者联盟

人工智能 华为云 ModelBox

Apache EventMesh事件驱动分布式运行时

EventMesh布道师

Serverless Faas EDA workflow eventmesh

详解React的Transition工作原理原理

夏天的味道123

React

用了8年MQ!聊聊消息队列的技术选型,哪个最香!

小小怪下士

Java RocketMQ RabbitMQ 消息队列

vue实战中的一些小技巧

yyds2026

Vue

阿里 CTO 程立:今年双 11,全面深度用云

云布道师

云计算 阿里巴巴 天猫

ElasticSearch深度分页详解

京东科技开发者

数据库 elasticsearch 分布式搜索引擎 分布式实时搜索引擎

【docker】导入镜像报错磁盘空间不足的解决方法 && 【docker】修改默认的存储路径

A-刘晨阳

Docker Linux 运维 11月月更

vue实战-完全掌握Vue自定义指令

yyds2026

Vue

会用postman不算牛,会用Eolink才是真的牛

陈橘又青

API

龙蜥理事长马涛荣获 “2022 年度开源人物”

OpenAnolis小助手

开源 操作系统 龙蜥社区 理事长 2022云栖大会

OpenHarmony集成OCR三方库实现文字提取

OpenHarmony开发者

OpenHarmony

详细解读 React useCallback & useMemo

夏天的味道123

React

经常被问到的react-router实现原理详解

夏天的味道123

React

全新的一套方法学会Spring Security究竟可以有多快?四天即可

了不起的程序猿

Java spring 程序员 架构师 框架

技术分享| Etcd如何实现分布式负载均衡及分布式通知与协调

anyRTC开发者

分布式 etcd 通知 式负载均衡 协调

数据中台选型必读(五):中台建设本质就是构建企业的公共数据层

雨果

数据中台

可防离职员工冒用身份,合合信息名片全能王与钉钉用数字名片打造安全“围栏”

合合技术团队

人工智能 大数据 钉钉 合合信息 名片

字节跳动基于ClickHouse优化实践之“资源隔离”

字节跳动数据平台

大数据 Clickhouse

软件测试丨测试大咖漫谈如何搞定软件质量?

测试人

软件测试 软件质量 自动化测试 测试开发

解读数仓常用模糊查询的优化方法

华为云开发者联盟

数据库 后端 华为云

传统 Web 框架部署与迁移

阿里巴巴云原生

阿里云 Serverless 云原生

商业智能工具BI口碑解读:Quick BI为何连续入选魔力象限?

夏日星河

Tokutek发布新版本的TokuDB和TokuMX_数据库_Benjamin Darfler_InfoQ精选文章