大数据

关注
收录了大数据频道下的 10241 篇内容
讲述数据获取、存储、管理、分析的方方面面,关注软件、实践、生态,挖掘最新的前沿技术,同时也思考大数据与AI和云计算的深度结合。
  • 全部
  • DataOps
  • 数据集成
  • DataMesh
  • 数据编织
  • 数据湖仓
  • 在离线混部
  • 实时计算
  • 其他
  • 全部
  • 文章
  • 视频
  • 话题
  • 电子书
Google Cloud 为 Spanner 数据库引入 HDD 层,将冷存储成本降低 80%
Google Cloud 为 Spanner 数据库引入 HDD 层,将冷存储成本降低 80%

Google Cloud 为 Spanner 数据库引入 HDD 层,降低冷存储成本 80%,优化数据存储策略。

小米数据湖架构演进:Iceberg、Paimon 与 AI 场景下的实践|QCon 北京
小米数据湖架构演进:Iceberg、Paimon 与 AI 场景下的实践|QCon 北京

在实际业务中如何实现数据在 Data 和 AI 场景的快速流转。

Paimon 流式湖仓架构在字节大规模业务场景的落地实践|QCon 北京
Paimon 流式湖仓架构在字节大规模业务场景的落地实践|QCon 北京

传统实时和离线开发中遇到的问题与挑战。

如何用元数据湖解决多 Lakehouse 治理难题|QCon 北京
如何用元数据湖解决多 Lakehouse 治理难题|QCon 北京

如何实现多 Lakehouse 中数据的发现和共享,以及多 Lakehouse 的统一管理和治理。

StarRocks x Iceberg: 探索Lakehouse架构极致查询性能|QCon 北京
StarRocks x Iceberg: 探索 Lakehouse 架构极致查询性能|QCon 北京

揭开 StarRocks 极致查询性能的面纱。

快手大时长应用可观测挑战及应对实践 | QCon北京
快手大时长应用可观测挑战及应对实践 | QCon 北京

快手长链路埋点标准建设、数据治理及架构建设的实践经验。

云上百万大数据任务的自动优化实践|QCon 北京
云上百万大数据任务的自动优化实践|QCon 北京

贝联珠贯在开源大数据平台成本优化方面的技术实践。

⾼性能全闪并⾏⽂件系统的设计和实践|QCon 北京
⾼性能全闪并⾏⽂件系统的设计和实践|QCon 北京

在深度学习领域中,数据是基⽯,算⼒是引擎。

AI 引领的企业级智能分析架构演进与行业实践 |QCon北京
AI 引领的企业级智能分析架构演进与行业实践 |QCon 北京

AI 如何推动数据分析从“工具辅助”到“决策建议和工作流协同”的质变。

基于多智能体协作和推理引擎构建下一代 ChatBI |QCon北京
基于多智能体协作和推理引擎构建下一代 ChatBI |QCon 北京

围绕腾讯云 ChatBI 的升级迭代进程展开。

LLM 引领数据分析进化在字节数据平台的实践|QCon北京
LLM 引领数据分析进化在字节数据平台的实践|QCon 北京

数据智能引擎从规则到意图、单一到全链路、“工具”到“智能助手”的跃迁。

AI 驱动的大数据自治:智能应对复杂运维挑战|QCon北京
AI 驱动的大数据自治:智能应对复杂运维挑战|QCon 北京

借助 AI 驱动实现大数据系统的故障和问题的快速洞察与自治能力。

直播预告|高并发海量数据压顶,你的数据库真的“扛得住”吗?
直播预告|高并发海量数据压顶,你的数据库真的“扛得住”吗?

当企业数字化转型进入深水区,核心业务系统正面临一场无声的战役:高并发流量冲击下,传统数据库架构频频“过载宕机”;

Lakehouse 如何重塑企业数据生态?
Lakehouse 如何重塑企业数据生态?

模块化的 Lakehouse 架构将成为企业的优选。

中国工程院院士郑纬民确认出席QCon北京并将发表主题演讲
中国工程院院士郑纬民确认出席 QCon 北京并将发表主题演讲

2025 年 4 月 10 - 12 日,QCon 全球软件开发大会将在北京召开。

Lakehouse 架构演进:从数据融合到智能决策的未来之路 | InfoQ《极客有约》
Lakehouse 架构演进:从数据融合到智能决策的未来之路 | InfoQ《极客有约》

紧扣 Data + Al 时代脉搏,探讨实时分析与智能决策的趋势。

重回AI战场!H.266/VVC的时代才刚刚开始
重回 AI 战场!H.266/VVC 的时代才刚刚开始

曾因技术门槛过高而沉寂多年的 H.266/VVC,凭借其绝佳的场景适应性,正在重获视频行业关注。

浅谈DeepSeek与Lakehouse的跨越式融合
浅谈 DeepSeek 与 Lakehouse 的跨越式融合

今天想跟大家聊聊最近比较火的 DeepSeek 私有部署 + Lakehouse 方案。作为一名数据从业者,我想结合自己的经验,跟大家聊聊我的看法。  

数势科技黎科峰:Agent接入DeepSeek,将帮企业打通数据应用最后一公里
数势科技黎科峰:Agent 接入 DeepSeek,将帮企业打通数据应用最后一公里

AI Agent 市场将迎来大规模爆发。

数势科技SwiftAgent全面接入DeepSeek-R1
数势科技 SwiftAgent 全面接入 DeepSeek-R1

作为行业领先的智能分析平台,数势科技 SwiftAgent 已全面接入 DeepSeek-R1,智能分析领域迎来超强进化。

Apache Hudi 1.0 正式发布
Apache Hudi 1.0 正式发布

这是一个支持近实时分析的事务型数据湖平台。

重磅!云器数据平台即日起免费开放,通用增量计算引擎首次面向全行业试用
重磅!云器数据平台即日起免费开放,通用增量计算引擎首次面向全行业试用

2025 年 1 月 15 日,云器科技举行了云器 Lakehouse 产品开放注册发布会。这标志着这家专注于数据基础设施的科技公司,正式向全球用户开放体验其创新的云湖仓产品。

Apache Doris 创始人:何为“现代化”的数据仓库?
Apache Doris 创始人:何为“现代化”的数据仓库?

Apache Doris 目前 GitHub Stars 已近 13,000,社区的贡献者达到近 670 名,平均每月活跃贡献者超过 120 名。这一成就使其超越了 Spark、Kafka 等项目。

AI 信创与湖仓一体化,2024 年数据库&湖仓发展与展望
AI 信创与湖仓一体化,2024 年数据库 & 湖仓发展与展望

展望未来,我意识到,尽管数据库行业正面临明显的瓶颈,湖仓领域却蕴藏着无尽的潜力,而 AI 的崛起将进一步提高从业门槛。

Apache Iceberg 赢得未来:2025 年如何前进
Apache Iceberg 赢得未来:2025 年如何前进

数据工程的未来已经到来,而它正是 Iceberg。

共探数据可信流通时代的密态新算力|走进隐语年度嘉年华精彩现场
共探数据可信流通时代的密态新算力|走进隐语年度嘉年华精彩现场

第二届隐语开源社区嘉年华成功举办,其聚焦数据可信流通,会上发布社区年度报告,其规模与影响力增长显著。各方探讨密态计算等技术,强调数据安全合规及隐私计算应用,还分享了金融等领域成果与人才培养经验,推动数据要素技术创新发展。

从 CephFS 到 JuiceFS:同程旅行亿级文件存储平台构建之路
从 CephFS 到 JuiceFS:同程旅行亿级文件存储平台构建之路

同程旅行因 CephFS 运维难度大,转向 JuiceFS 构建存储平台,覆盖多场景,规模可观。文章介绍了 JuiceFS 选型原因、平台化建设、高可用集群部署、落地收益、挑战与优化,还提及未来展望,包括开发分布式 KV 存储系统等。

数据处理不再是“脏活累活”,听听开发者们怎么说?
数据处理不再是“脏活累活”,听听开发者们怎么说?

一直以来,数据处理都被视作“脏活累活”,从数据的收集、清洗、转换,再到存储、分析,每个步骤都可能遇到各种挑战,繁琐且耗时。

Apache Doris 创始人:何为“现代化”的数据仓库?
Apache Doris 创始人:何为“现代化”的数据仓库?

Apache Doris 创始人 & PMC 成员马如悦在开场演讲中,围绕“现代化数据仓库”这一主题,指出 3.0 版本是 Apache Doris 研发路程中的重要里程碑,他将这一进展总结为“实时之路”、“统一之路”和“弹性之路”,

    产品与项目之间的“敏态”与“稳态”
    产品与项目之间的“敏态”与“稳态”

    王亚东 | 京东零售集团 Y业务部产品总监

    立即下载
    京东中台业务架构敏捷性方法 MotriDSP 落地实践

    李伟 | 京东 资深架构师

    立即下载
    微盟如何使用 Serverless 实现 SaaS 服务流量优化与快速响应

    李盛雁 | 上海微盟 运维部/容器运维专家

    立即下载