大数据
讲述数据获取、存储、管理、分析的方方面面,关注软件、实践、生态,挖掘最新的前沿技术,同时也思考大数据与AI和云计算的深度结合。
- 全部
- DataOps
- 数据集成
- DataMesh
- 数据编织
- 数据湖仓
- 在离线混部
- 实时计算
- 其他

Google Cloud 为 Spanner 数据库引入 HDD 层,将冷存储成本降低 80%
Google Cloud 为 Spanner 数据库引入 HDD 层,降低冷存储成本 80%,优化数据存储策略。

小米数据湖架构演进:Iceberg、Paimon 与 AI 场景下的实践|QCon 北京
在实际业务中如何实现数据在 Data 和 AI 场景的快速流转。

Paimon 流式湖仓架构在字节大规模业务场景的落地实践|QCon 北京
传统实时和离线开发中遇到的问题与挑战。

如何用元数据湖解决多 Lakehouse 治理难题|QCon 北京
如何实现多 Lakehouse 中数据的发现和共享,以及多 Lakehouse 的统一管理和治理。

StarRocks x Iceberg: 探索 Lakehouse 架构极致查询性能|QCon 北京
揭开 StarRocks 极致查询性能的面纱。

快手大时长应用可观测挑战及应对实践 | QCon 北京
快手长链路埋点标准建设、数据治理及架构建设的实践经验。

“付费删数据,否则全网叫卖!”十年未更新系统,Oracle 云曝出前所未有的重大生产事故,全球 14 万企业数据遭暗网“清仓大促”
在简单粗暴的否认背后,越来越多的证据正在打 Oracle 的脸。

云上百万大数据任务的自动优化实践|QCon 北京
贝联珠贯在开源大数据平台成本优化方面的技术实践。

⾼性能全闪并⾏⽂件系统的设计和实践|QCon 北京
在深度学习领域中,数据是基⽯,算⼒是引擎。

AI 引领的企业级智能分析架构演进与行业实践 |QCon 北京
AI 如何推动数据分析从“工具辅助”到“决策建议和工作流协同”的质变。

基于多智能体协作和推理引擎构建下一代 ChatBI |QCon 北京
围绕腾讯云 ChatBI 的升级迭代进程展开。

LLM 引领数据分析进化在字节数据平台的实践|QCon 北京
数据智能引擎从规则到意图、单一到全链路、“工具”到“智能助手”的跃迁。

AI 驱动的大数据自治:智能应对复杂运维挑战|QCon 北京
借助 AI 驱动实现大数据系统的故障和问题的快速洞察与自治能力。

直播预告|高并发海量数据压顶,你的数据库真的“扛得住”吗?
当企业数字化转型进入深水区,核心业务系统正面临一场无声的战役:高并发流量冲击下,传统数据库架构频频“过载宕机”;

Lakehouse 如何重塑企业数据生态?
模块化的 Lakehouse 架构将成为企业的优选。

中国工程院院士郑纬民确认出席 QCon 北京并将发表主题演讲
2025 年 4 月 10 - 12 日,QCon 全球软件开发大会将在北京召开。

Lakehouse 架构演进:从数据融合到智能决策的未来之路 | InfoQ《极客有约》
紧扣 Data + Al 时代脉搏,探讨实时分析与智能决策的趋势。

重回 AI 战场!H.266/VVC 的时代才刚刚开始
曾因技术门槛过高而沉寂多年的 H.266/VVC,凭借其绝佳的场景适应性,正在重获视频行业关注。

浅谈 DeepSeek 与 Lakehouse 的跨越式融合
今天想跟大家聊聊最近比较火的 DeepSeek 私有部署 + Lakehouse 方案。作为一名数据从业者,我想结合自己的经验,跟大家聊聊我的看法。

数势科技黎科峰:Agent 接入 DeepSeek,将帮企业打通数据应用最后一公里
AI Agent 市场将迎来大规模爆发。

数势科技 SwiftAgent 全面接入 DeepSeek-R1
作为行业领先的智能分析平台,数势科技 SwiftAgent 已全面接入 DeepSeek-R1,智能分析领域迎来超强进化。

Apache Hudi 1.0 正式发布
这是一个支持近实时分析的事务型数据湖平台。

重磅!云器数据平台即日起免费开放,通用增量计算引擎首次面向全行业试用
2025 年 1 月 15 日,云器科技举行了云器 Lakehouse 产品开放注册发布会。这标志着这家专注于数据基础设施的科技公司,正式向全球用户开放体验其创新的云湖仓产品。

Apache Doris 创始人:何为“现代化”的数据仓库?
Apache Doris 目前 GitHub Stars 已近 13,000,社区的贡献者达到近 670 名,平均每月活跃贡献者超过 120 名。这一成就使其超越了 Spark、Kafka 等项目。

AI 信创与湖仓一体化,2024 年数据库 & 湖仓发展与展望
展望未来,我意识到,尽管数据库行业正面临明显的瓶颈,湖仓领域却蕴藏着无尽的潜力,而 AI 的崛起将进一步提高从业门槛。

Apache Iceberg 赢得未来:2025 年如何前进
数据工程的未来已经到来,而它正是 Iceberg。

共探数据可信流通时代的密态新算力|走进隐语年度嘉年华精彩现场
第二届隐语开源社区嘉年华成功举办,其聚焦数据可信流通,会上发布社区年度报告,其规模与影响力增长显著。各方探讨密态计算等技术,强调数据安全合规及隐私计算应用,还分享了金融等领域成果与人才培养经验,推动数据要素技术创新发展。

从 CephFS 到 JuiceFS:同程旅行亿级文件存储平台构建之路
同程旅行因 CephFS 运维难度大,转向 JuiceFS 构建存储平台,覆盖多场景,规模可观。文章介绍了 JuiceFS 选型原因、平台化建设、高可用集群部署、落地收益、挑战与优化,还提及未来展望,包括开发分布式 KV 存储系统等。

数据处理不再是“脏活累活”,听听开发者们怎么说?
一直以来,数据处理都被视作“脏活累活”,从数据的收集、清洗、转换,再到存储、分析,每个步骤都可能遇到各种挑战,繁琐且耗时。

Apache Doris 创始人:何为“现代化”的数据仓库?
Apache Doris 创始人 & PMC 成员马如悦在开场演讲中,围绕“现代化数据仓库”这一主题,指出 3.0 版本是 Apache Doris 研发路程中的重要里程碑,他将这一进展总结为“实时之路”、“统一之路”和“弹性之路”,