发布了 7 篇内容
共 24047字, 被阅读 514次
获得了 6 次赞同
获得了 2次喜欢, 获得了 4 次收藏
参与了 2 次互动
互动包含发布评论、点赞评论、参与投票等

流式数据质量监控的技术调研及选型思考
本文是字节跳动数据质量平台针对流式数据质量监控的技术调研及选型思考。

注意,你所做的 A/B 实验,可能是错的!
对于 A/B 实验原理认知的缺失,致使许多企业在业务增长的道路上始终在操作一批“错误的 A/B 实验”。这些实验并不能指导产品的优化和迭代,甚至有可能与我们的初衷背道而驰,导致“负增长”。

揭秘字节跳动基于 Hudi 的实时数据湖平台
字节跳动实时数据湖平台的应用场景介绍

一套架构框架如何满足流批数据质量监控
介绍字节跳动在弥合大数据场景下数据质量校验与计算消耗资源大、校验计算时间长的冲突等方面的经验。

在字节,大规模埋点数据治理这么做!
字节跳动内部统一的埋点平台——流量平台,已经覆盖了字节内部 2000 多个应用,管理埋点(事件)数 20 万,每天产生的埋点数据量超过万亿,每年能给公司节省的成本超亿元。

Presto 在字节跳动的内部实践与优化(优化篇)
为了进一步优化查询性能,提高资源使用效率,从 2020 年开始,我们在生产环境大规模使用 Presto。

Presto 在字节跳动的内部实践与优化(实践篇)
在字节跳动内部,Presto 主要支撑了 Ad-hoc 查询、BI 可视化分析、近实时查询分析等场景,日查询量接近 100 万条。