大数据

关注
收录了大数据频道下的 10222 篇内容
讲述数据获取、存储、管理、分析的方方面面,关注软件、实践、生态,挖掘最新的前沿技术,同时也思考大数据与AI和云计算的深度结合。
  • 全部
  • DataOps
  • 数据集成
  • DataMesh
  • 数据编织
  • 数据湖仓
  • 在离线混部
  • 实时计算
  • 其他
  • 全部
  • 文章
  • 视频
  • 话题
  • 电子书
数势科技SwiftAgent全面接入DeepSeek-R1
数势科技 SwiftAgent 全面接入 DeepSeek-R1

作为行业领先的智能分析平台,数势科技 SwiftAgent 已全面接入 DeepSeek-R1,智能分析领域迎来超强进化。

Apache Hudi 1.0 正式发布
Apache Hudi 1.0 正式发布

这是一个支持近实时分析的事务型数据湖平台。

重磅!云器数据平台即日起免费开放,通用增量计算引擎首次面向全行业试用
重磅!云器数据平台即日起免费开放,通用增量计算引擎首次面向全行业试用

2025 年 1 月 15 日,云器科技举行了云器 Lakehouse 产品开放注册发布会。这标志着这家专注于数据基础设施的科技公司,正式向全球用户开放体验其创新的云湖仓产品。

Apache Doris 创始人:何为“现代化”的数据仓库?
Apache Doris 创始人:何为“现代化”的数据仓库?

Apache Doris 目前 GitHub Stars 已近 13,000,社区的贡献者达到近 670 名,平均每月活跃贡献者超过 120 名。这一成就使其超越了 Spark、Kafka 等项目。

AI 信创与湖仓一体化,2024 年数据库&湖仓发展与展望
AI 信创与湖仓一体化,2024 年数据库 & 湖仓发展与展望

展望未来,我意识到,尽管数据库行业正面临明显的瓶颈,湖仓领域却蕴藏着无尽的潜力,而 AI 的崛起将进一步提高从业门槛。

Apache Iceberg 赢得未来:2025 年如何前进
Apache Iceberg 赢得未来:2025 年如何前进

数据工程的未来已经到来,而它正是 Iceberg。

共探数据可信流通时代的密态新算力|走进隐语年度嘉年华精彩现场
共探数据可信流通时代的密态新算力|走进隐语年度嘉年华精彩现场

第二届隐语开源社区嘉年华成功举办,其聚焦数据可信流通,会上发布社区年度报告,其规模与影响力增长显著。各方探讨密态计算等技术,强调数据安全合规及隐私计算应用,还分享了金融等领域成果与人才培养经验,推动数据要素技术创新发展。

从 CephFS 到 JuiceFS:同程旅行亿级文件存储平台构建之路
从 CephFS 到 JuiceFS:同程旅行亿级文件存储平台构建之路

同程旅行因 CephFS 运维难度大,转向 JuiceFS 构建存储平台,覆盖多场景,规模可观。文章介绍了 JuiceFS 选型原因、平台化建设、高可用集群部署、落地收益、挑战与优化,还提及未来展望,包括开发分布式 KV 存储系统等。

数据处理不再是“脏活累活”,听听开发者们怎么说?
数据处理不再是“脏活累活”,听听开发者们怎么说?

一直以来,数据处理都被视作“脏活累活”,从数据的收集、清洗、转换,再到存储、分析,每个步骤都可能遇到各种挑战,繁琐且耗时。

Apache Doris 创始人:何为“现代化”的数据仓库?
Apache Doris 创始人:何为“现代化”的数据仓库?

Apache Doris 创始人 & PMC 成员马如悦在开场演讲中,围绕“现代化数据仓库”这一主题,指出 3.0 版本是 Apache Doris 研发路程中的重要里程碑,他将这一进展总结为“实时之路”、“统一之路”和“弹性之路”,

数势科技指标平台, 让数据产生最大价值。
数势科技指标平台, 让数据产生最大价值。

近来,指标体系和指标平台的重要性正被越来越多的业界同仁所认可。作为行业领先的数据智能产品提供商,数势科技最早推出了统一指标开发管理平台这一突破性产品(2021 年获得软著),并首家完成了中国信通院数据指标管理平台技术要求专项测试,此外还出版了行业首本指标体系与指标平台的专著,并在三年之间内成功交付了众多行业头部客户,积累了丰富的产品落地经验,成功交付的客户量为业内最多。

京东大数据治理探索与实践 | 京东零售技术实践
京东大数据治理探索与实践 | 京东零售技术实践

在当今的数据驱动时代,数据作为关键生产要素之一,其在商业活动中的战略价值愈加凸显,京东也不例外。

第二届隐语开源社区嘉年华活动报名开始
第二届隐语开源社区嘉年华活动报名开始

探索 AI 时代下,数据要素的无限可能。

揭秘 JDQ 限流架构:实时数据链路的多维动态带宽管控|京东零售技术实践
揭秘 JDQ 限流架构:实时数据链路的多维动态带宽管控|京东零售技术实践

在数字化转型的浪潮席卷之下,大数据和云计算技术已成为企业创新和发展的关键驱动力。尤其是以京东为代表的电商平台为例,其日常运营中持续生成海量数据,涵盖实时交易记录、点击曝光统计及用户行为轨迹等,这些数据对精准业务决策、深化用户体验优化等方面具有重要意义。

2024腾讯云大数据年度干货合集2024腾讯云大数据年度干货合集
2024 腾讯云大数据年度干货合集

腾讯云大数据 2024 年度技术合集强势来袭!从 RAG 到数据湖仓,再到 BI 引擎,热门技术应有尽有。更有零售、教育、金融等行业的精选案例,以及权威的资质认证。

降本增效神器?Lakehouse是怎么在大厂里火起来的
降本增效神器?Lakehouse 是怎么在大厂里火起来的

Lakehouse 会是数据分析的新标配吗?

“卷王”一次上架百余款大模型,改写游戏规则
“卷王”一次上架百余款大模型,改写游戏规则

新产品与技术的更新不应是“拿着锤子找钉子”,而是去繁就简,实用至上。

亚马逊云科技三大AI产品线齐更新:颠覆性变革成为新常态,快速创新是生存法则
亚马逊云科技三大 AI 产品线齐更新:颠覆性变革成为新常态,快速创新是生存法则

亚马逊云科技大动作🤖!AI 飞跃!

生成式 AI 项目越来越多,但数据管理要怎么才能高效进行?
生成式 AI 项目越来越多,但数据管理要怎么才能高效进行?

未来 5 到 10 年,所有应用都会是 AI 驱动的应用。

零售银行全渠道营销策略设计与平台架构实践
零售银行全渠道营销策略设计与平台架构实践

银行如何构建无缝的客户体验?

Cloudflare 支持短期 SSH 访问,无需生成 SSH 凭证
Cloudflare 支持短期 SSH 访问,无需生成 SSH 凭证

本文提到了 Cloudflare 集成 BastionZero,支持短期 SSH 访问,用临时证书替代长期密钥,简化管理并增强安全性,实现像管理应用程序一样的 SSH 访问控制。

字节跳动开源云原生数据仓库ByConity有奖众测,邀你体验完整的数仓能力
字节跳动开源云原生数据仓库 ByConity 有奖众测,邀你体验完整的数仓能力

为了让更多的开发者深入了解并体验 ByConity bsp 模式的能力,InfoQ 和 ByConity 社区联合举办“ByConity 有奖众测活动”,邀请广大开发者参与 ByConity bsp 模式在离线数仓场景的实际测试,通过亲身实践来感受其带来的高效与便捷。

Meta 利用强化学习优化数据中心的可持续性
Meta 利用强化学习优化数据中心的可持续性

本文提到了 Meta 使用强化学习优化数据中心环境控制,减少能源和水消耗,应对气候变化。试点地区实现能耗降低 20%,用水量降低 4%。

存算分离的过去、现在和未来
存算分离的过去、现在和未来

存算分离架构,作为数据处理领域的一个重要概念,从其最初的雏形到如今广泛应用,经历了多次迭代和变革。

兼顾高性能与低成本,浅析 Apache Doris 异步物化视图原理及典型场景
兼顾高性能与低成本,浅析 Apache Doris 异步物化视图原理及典型场景

面对有限的计算资源,成本及性能如何平衡,严格的资源管控也显得尤为重要

AI造脸“一眼真”,身份验证难上加难,技术可以用魔法打败魔法吗?
AI 造脸“一眼真”,身份验证难上加难,技术可以用魔法打败魔法吗?

生成式 AI 带来全新挑战,眼见不一定为真。

AI时代的数据底座,StarRocks 2024 年度技术峰会带你探索湖仓架构
AI 时代的数据底座,StarRocks 2024 年度技术峰会带你探索湖仓架构

阿里集团、Snowflake、腾讯音乐、小红书、Shopee 等 30+ 行业标杆企业联袂呈现,共话 AI 时代下的湖仓技术创新与未来

生成式AI项目,数据管理的“坑”和“诀窍” |InfoQ《极客有约》
生成式 AI 项目,数据管理的“坑”和“诀窍” |InfoQ《极客有约》

生成式 AI 项目越来越多,数据管理的难度也跟着升级!怎样在合规和隐私保护的同时,保持高效?如何优化数据质量,让模型表现更靠谱?

Podman Desktop 1.13发布,支持Hyper-V
Podman Desktop 1.13 发布,支持 Hyper-V

Podman Desktop 1.13 发布,支持 Hyper-V 管理 Podman 机器,集成镜像搜索功能,更新空白状态页,优化 Kubernetes 导航,新增镜像层浏览器扩展,修复错误并提升用户体验。

    拥抱 AI,我们需要什么样的存储系统?
    拥抱 AI,我们需要什么样的存储系统?

    苏锐 | JuiceFS 合伙人

    立即下载
    Iceberg 湖仓一体在 B 站的实践

    李锐 | 哔哩哔哩 OLAP 平台/资深开发工程师

    立即下载
    AI多媒体技术在内容审核场景实践探索

    马金龙 | 趣丸科技 媒体算法负责人

    立即下载