在QCon北京2019大会上,陈星讲师做了《ClickHouse 在头条的技术演进》主题演讲,主要内容如下。
演讲简介:
$$ 主题摘要
ClickHouse 技术引擎特点;
ClickHouse 在字节跳动的应用场景;
ClickHouse 主要的技术改进,词典编码、HA 改进、HDFS 数据导入、Map 类型支持、数据读取方式优化等;
ClickHouse 后续的 ToDo。
听众受益
ClickHouse 应用场景介绍;
ClickHouse 关键技术点及改进。
讲师介绍:
陈星
字节跳动 高级研发工程师
陈星,字节跳动高级研发工程师,主要负责 ClickHouse 查询引擎相关的技术规划、改进等工作,在 ClickHouse 之前在 IBM 从事过多年的数据库研发工作,在 OLAP、OLTP 等领域有深厚的技术积累。
完整演讲 PPT 下载链接:
https://qcon.infoq.cn/2019/beijing/schedule
更多内容推荐
ClickHouse 挺快,esProc SPL 更快
开源分析数据库ClickHouse以快著称,真的如此吗?我们通过对比测试来验证一下。
2022-12-15
什么是大数据:从 GFS 到 Dataflow,12 年大数据生态演化图
要想学好大数据,我们需要先正本清源,弄清楚大数据在技术上到底涵盖了些什么。所以今天这节课,我就从大数据技术的核心理念和历史脉络这两个角度,来带你理解下什么是大数据技术。
2021-09-15
开篇词 | 读论文是成为优秀工程师的成年礼
阅读论文就是去理解武功对应的“心法”,它可以让你不仅仅是只学会今时今日有用,而是能做到一辈子都受益。
2021-09-15
力扣每日一练之二维数组上篇 Day4
🍕前面的话🥞
2022-06-15
Databend Roadmap in 2023
Databend 经历了 2022 年一整年的研发,Databend 的功能性和稳定性得到了显著增强,一些用户开始在生产中使用。Databend 帮助他们极大地 降低 了成本和操作的复杂性问题。
2023-02-01
ClickHouse 挺快,esProc SPL 更快
ClickHouse 挺快,esProc SPL 更快
2022-08-29
开篇词 | 入门 Spark,你需要学会“三步走”
通过“学、用、写”不断迭代的学习方式,我把零散的开发技巧归纳成了结构化的知识体系。
2021-09-06
RadonDB MySQL on Kubernetes 2.1.3 发布!
RadonDB MySQL Kubernetes 于 3 月 24 日正式发布新版本 2.1.3 。该版本主要基于在 2.1.2 进行功能优化和升级。
2022-03-25
数据分析与可视化在企业中的日常应用
随着大数据时代的到来,数据分析与可视化在企业日常运营中扮演着日益重要的角色。通过使用商业智能(BI)工具如瓴羊Quick BI等,企业可以提高数据分析工作效率,优化内部沟通与协调机制,从而实现高效运营。本文将重点探讨数据分析与可视化在日常运营中的重要
2023-06-29
Impala 基本架构
Impala最初是由Cloudera公司开发的,其最初设计动机是充分结合传统数据库与大数据系统Hadoop的优势,构造一个全新的、支持SQL与多租户、并具备良好的灵活性和扩展性的高性能查询引擎。
2022-10-26
10|稀疏索引:为什么高并发写不推荐关系数据库?
这节课,我们将要讨论OLAP和OLTP数据库的索引、存储、数据量以及应用的不同场景。
2022-11-14
Spark 编程基础 (Python 版)
Spark编程基础(Python版)
2022-11-30
数据治理(十三):Ranger 安装与启动
Ranger的安装这里选择单节点安装即可,后期需要在Ranger中安装Hive权限管理的插件,也需要在有Ranger环境下才能安装此插件,此插件管理Hive访问权限,必须安装到对应的Hive 服务器端,所以这里我们将Ranger安装到node1节点上(node1节点是HDFS节点,并且此节
2022-09-11
学习方法:建立你的大数据知识网络
一篇篇的大数据论文,并不是教科书里的一个章节或者一个知识点,而是对于一个重要的系统问题的解决方案。在读论文之前,先尝试自己去思考和解决对应的问题,有助于你更深刻地理解问题和解决方案的重点。
2021-09-22
OpenMLDB v0.7.0 发布
2023 新年伊始,OpenMLDB v0.7.0 正式发布。本次版本更新重点增强了易用性和稳定性,下文将详细介绍主要改进和更新内容。
2023-01-13
【Linux 系统】fdisk 相关分区命令。
fdisk是一个常用的Linux命令行工具,用于创建、管理和修改磁盘分区。以下是一些常用的 fdisk命令:
2023-07-21
正确性案例(中):常见分布式数据方案的设计原理是什么?
这节课我们学习了分布式数据系统的设计原理,分析了Redis,RocksDB、Spanner和TiDB在架构上的取舍思路。
2021-02-03
ClickHouse 与 Amazon S3 结合?一起来探索其中奥秘
ClickHouse 简介
2023-03-03
ClickHouse 挺快,esProc SPL 更快
开源分析数据库ClickHouse以快著称,真的如此吗?我们通过对比测试来验证一下。
2023-01-10
推荐阅读
3、MySQL 日志文件与数据文件详解
2023-09-27
第一财经《大发精准导师单带回血上岸》MBA 智库百科
2023-09-04
14|跳数索引:后起新秀 ClickHouse
2022-11-23
数智赋能云课堂第 3 期·数据管理与规划之数据治理
FFA 2023 「生产实践」专场:Flink 大规模技术优化与生产实践
2023-12-04
12|引擎分片:Elasticsearch 如何实现大数据检索?
2022-11-18
深入解析 LLaMA 如何改进 Transformer 的底层结构
2023-12-07
电子书
大厂实战PPT下载
换一换 吉妙通 | 金山办公 移动端研发总监
李飞 博士 | 数势科技 AI负责人
张颖峰 | 英飞流 CEO
评论