写点什么

20 个大数据必知领域之「Druid」

2020 年 5 月 28 日

20个大数据必知领域之「Druid」


Druid 是 MetaMarket 公司研发,专为海量数据集上的做高性能 OLAP (OnLine Analysis Processing) 而设计的数据存储和分析系统,目前 Druid 已经在 Apache 基金会下孵化。Druid 的主要特性:


  • 交互式查询 ( Interactive Query )

  • 高可用性 ( High Available )

  • 可伸缩 ( Horizontal Scalable )

  • 并行处理 ( Parallel Processing )

  • 丰富的查询能力 ( Rich Query )


一线实践案例



会议演讲推荐



2020 年 5 月 28 日 16:45274

评论

发布
暂无评论
  • 数据安全计算的技术架构

    演讲嘉宾雷小平,腾讯数据平台中心负责人内容介绍在大数据时代为了能更大的发挥数据价值,数据交易是大家经常谈论的一个话题,但直接对数据进行买卖不但无法让数据价值最大化,也无法保障数据拥有方的数据安全。如何解决这些问题?腾讯的神盾沙箱将数据交易融入到数据计算的过程中,既能发挥数据价值,又降低了数据泄漏的风险。本次分享的是神盾沙箱在系统实践中沉淀出来的一些经验总结,希望跟听众共同来探讨过程中遇到的一些问题和思路。内容大纲 百万富翁的故事; 安全计算场景介绍; 安全计算的一些新方法; 未来的展望。

    2019 年 1 月 2 日

  • 架构师训练营第一周作业

    系统中每个消费者都有一张卡,在管理中心注册缴费,卡内记着消费者的身份、余额。

    2020 年 9 月 19 日

  • MongoDB + Spark 连接实战

    2020 年 2 月 20 日

  • Uber 搭建基于 Kafka 的跨数据中心拷贝平台

    演讲嘉宾徐宏亮,Uber Senior Software Engineer内容介绍Uber 拥有20+ Kafka 集群来处理系统和 App 的数据,其中一些数据需要跨数据中心拷贝。拷贝每天需要处理 PB 级的数据量,并且要保证拷贝中不会丢失数据,这带来了性能和运维各方面的挑战。在实现跨数据中心拷贝的过程中,Uber 经历了从 MirrorMaker 到 uReplicator 再到 Federated uReplicator 的迁移。在这个演讲中,我将分享 Uber 为什么要开发 uReplicator 和 Federated uReplicator,uReplicator/Federated uReplicator 的架构和技术细节,在开发过程中遇到的问题并且如何解决的。内容大纲 Uber 的跨数据中心 replication 用例 为什么 Uber 要开发 uReplicator uReplicator 架构 Federated uReplicator架构

    2019 年 1 月 2 日

  • 【第十五周】大作业一——同城快递系统设计

    通达同城快递系统作业设计

    2020 年 9 月 19 日

  • Pulsar 如何使用分层分片的架构来解决使用和运维的痛点

    本次分享介绍 Pulsar 的特性,并深入分析 Pulsar 以分片为中心的分层架构,以及 Pulsar 如何在设计中考虑和解决用户使用和运维过程中的痛点。

  • 2020 年度十大开源杰出贡献人物参评人介绍:史少锋

    2020 年度十大开源杰出贡献人物参评人介绍。

  • Data Artisans:浴火重生的新一代大数据计算引擎 Flink

    Apache Flink是一个年轻的新型处理引擎,是Spark的主要竞争对手,它设计理念先进,但是工程实现上相对落后。

    2018 年 5 月 4 日

  • week11 总结

    安全 高可用

    2020 年 8 月 26 日

  • 食堂就餐系统设计

    系统中每个消费者都有一张卡,在管理中心注册缴费,卡内记着消费者的身份、余额。

    2020 年 6 月 10 日

  • Clickhouse 在快手的大规模应用与架构改进

    在 ArchSummit 北京 2019 大会上,李振炜讲师做了《Clickhouse 在快手的大规模应用与架构改进》主题演讲。

  • CAP 定理与 Doris 临时失效处理

    CAP定理与Doris 临时失效处理

    2020 年 7 月 15 日

  • ClickHouse 在头条的技术演进

    本次分享介绍技术引擎 ClickHouse 在头条的演进。

  • 七牛存储运维实践

    演讲嘉宾林天智,七牛存储&直播运维 负责人内容介绍七牛原本的告警系统是通过zabbix来触发,然后有一个人工告警通知的团队来通知各个业务线告警,再由各自的运维团队处理告警。这个在规模小的时候没有问题,但是在机器规模变大的时候会遇到很多问题,告警数量爆增,信息流单项无法确认,缺乏历史记录等。需要针对这个来做改造,但是过程中会遇到大量告警如何迁移,如何保证不影响当前的正常工作等,中间运用到一些开源服务比如:prometheus,pushgateway,node_exporter等,以及一些自己开发的系统。最终存储运维相关的故障减少80%以上,以及不需要人工告警团队再继续通知。资源利用以及集群复制。当前存储的部署是基于物理机部署,对于资源利用很不充分,也不利于集群的复制(私有云),会从这些角度讲如何从物理集群迁移到容器集群。内容大纲 监控数据搜集; 告警收敛; 告警后续处理; 容器化方案。

    2018 年 12 月 26 日

  • CAP 原理简介

    现在越来越多的系统采用了分布式,分布式在设计之初就要考虑如何设计,CAP理论就是一个很好的参考方向。设计的时候根据业务场景和具体情况来设计来满足CP还是AP

    2020 年 7 月 15 日

  • 大型互联网应用建设常用技术方案与手段,主要解决哪些问题?

    好的系统、优秀的架构不是设计出来的,而是不断演化出来的;技术的进化是伴随着业务的不断壮大。

    2020 年 10 月 11 日

  • 知名大厂如何搭建大数据平台?

    今天我们来看一下淘宝、美团和滴滴的大数据平台,一方面进一步学习大厂大数据平台的架构,另一方面也学习大厂的工程师如何画架构图。

    2019 年 1 月 1 日

  • 架构师训练营第八周作业

    有两个单向链表(链表长度分别为 m,n),这两个单向链表有可能在某个元素合并,也可能不合并,如下图所示的这样。现在给定两个链表的头指针,在不修改链表的情况下,如何快速地判断这两个链表是否合并?如果合并,找到合并的元素,也就是图中的 x 元素。请用

    2020 年 11 月 16 日

  • 食堂就餐卡设计

    系统中每个消费者都有一张卡,在管理中心注册缴费,卡内记着消费者的身份、余额。

    2020 年 10 月 25 日

  • 如何设计 Go 语言中的 channel

    如果让你来设计Go中的channel,你会如何设计?

    2020 年 9 月 25 日

发现更多内容

OpenShift 4 监控技术栈解析

东风微鸣

Kubernetes Prometheus openshift 可观察性 Thanos

搞定秒杀,只需要这几步!!

架构师修行之路

缓存 分布式 微服务 秒杀

马云被约谈,阿里大数据的羹怎么分给每一个人?

CECBC区块链专委会

区块链 大数据

区块链是未来数字经济标志性的发明技术

CECBC区块链专委会

区块链 数字经济

目标检测之YOLOv1

Dreamer

嵌入式的我们为什么要学ROS

良知犹存

ROS

专业级沙箱与恶意样本的自动化分析

京东智联云开发者

云计算 监控 虚拟化

哭了,前阿里P8见我spring太烂,把系列合集甩在了我脸上

周老师

程序员面试题为什么出得天花乱坠,实际工作中这些根本用不到?

Java架构师迁哥

YOLODet--YOLO系列网络结构图(YOLOv5,YOLOv4,PPYOLO,YOLOv3)

wuzhihao7788

学习 AI 目标追踪

数据库JDBC:PreparedStatement

大规模数据处理学习者

JDBC SQL预处理 PrepareStatement

Scrapy中process_request返回request和None的区别

LLLibra146

Python 爬虫 python 爬虫 Scrapy

图解 | 不得错过的Binder浅析(一)

哈利迪

android

巨建华:区块链+金融的难点

CECBC区块链专委会

区块链 金融

YOLODet 最强PyTorch版的YOLOv5、YOLOv4、PP-YOLO、YOLOv3复现

wuzhihao7788

学习 AI 目标追踪

scrapy学习之爬虫练习平台2

LLLibra146

Python 爬虫 python 爬虫 Scrapy

DDIA 读书笔记(4)多节点数据复制方案

莫黎

读书笔记

聊点缓存——Part 1

姜雨生

redis 缓存

【面经】面试官:做过性能优化的工作吗?你会从哪些方面入手做性能优化呢?

冰河

面试 性能优化 JVM 高并发 高性能

一站式低延迟直播连麦解决方案

anyRTC开发者

音视频 WebRTC 直播 RTC sdk

scrapy学习之爬虫练习平台爬取

LLLibra146

爬虫 python 爬虫 Scrapy

Java9 新特性 - 下篇

hepingfly

Java 新特性

scrapy学习之爬虫练习平台4

LLLibra146

Python 爬虫 python 爬虫 Scrapy

智能驾驶看湘江:中国智能网联汽车产业的“长沙样本”

脑极体

甲方日常 43

句子

工作 随笔杂谈 日常

Amdocs收购OPENET:关于5G应用落地的思考

VoltDB

大数据 数据分析 5G 物联网

scrapy学习之爬虫练习平台3

LLLibra146

Python 爬虫 python 爬虫 Scrapy

scrapy学习之爬虫练习平台5

LLLibra146

Python 爬虫 python 爬虫 Scrapy

复盘逆袭之路!三个月时间深造,怒斩拼多多、字节、蚂蚁金服破50W年薪Offer(含自学路线图)

Java架构追梦

Java 学习 架构 面试 数据结构与算法

芯片破壁者(十九):显卡的战国与帝国

脑极体

架构师训练营第七周作业

邓昀垚

NLP领域的2020年大事记及2021展望

NLP领域的2020年大事记及2021展望

20个大数据必知领域之「Druid」-InfoQ