大数据

关注
收录了大数据频道下的 10119 篇内容
讲述数据获取、存储、管理、分析的方方面面,关注软件、实践、生态,挖掘最新的前沿技术,同时也思考大数据与AI和云计算的深度结合。
  • 全部
  • DataOps
  • 数据集成
  • DataMesh
  • 数据编织
  • 数据湖仓
  • 在离线混部
  • 实时计算
  • 其他
  • 全部
  • 文章
  • 视频
  • 话题
  • 电子书
从数据库历史,看分布式数据库的架构设计趋势|ArchSummit
从数据库历史,看分布式数据库的架构设计趋势|ArchSummit

传统单机数据库的核心技术和理论基础成型多年,如今已经不再能够满足当前企业的主流需求。我们看到大量企业在关注两个问题:要不要使用分布式数据库?应该使用哪款分布式数据库系统? 本次演讲将梳理数据库发展历史,剖析当前企业实际数据管理需求,并给出参考建议。听完本次演讲,你将了解到 KunlunBase 架构、核心功能以及技术实现,获取关于分布式数据库系统的架构设计趋势。

顺丰科技DataOps落地实践经验|ArchSummit
顺丰科技 DataOps 落地实践经验|ArchSummit

DataOps 是大数据研发体系的重要理念,顺丰大数据也在过去的几年中通过各种办法来提高各个环节的开发效率,但也逐渐遇到了提效手段分散不成体系、提效边际效应递减等困境。

新增300多项功能,Oracle Database 23ai正式发布!年近50岁的数据库巨头正迈入AI时代
新增 300 多项功能,Oracle Database 23ai 正式发布!年近 50 岁的数据库巨头正迈入 AI 时代

值得一提的是,这款数据库的曾用名是 Database 23c,后来由于数据库中添加了一些 AI 功能而变更为现在的名称。

Apache Doris 基于 Workload Group 的负载隔离能力解读
Apache Doris 基于 Workload Group 的负载隔离能力解读

Workload Group 是通过对工作负载进行分组管理,实现对内存和 CPU 资源的精细化管控。

“数据虚拟化之父”解密数据编织,大模型时代的数据生产力就靠它了
“数据虚拟化之父”解密数据编织,大模型时代的数据生产力就靠它了

生成式 AI 时代,数据编织将成为下一代数据管理的主流范式。

Copilot for SQL Azure 开启内部预览
Copilot for SQL Azure 开启内部预览

微软宣布开启 Copilot for SQL Azure 内部预览,提供自然语言到 SQL 的转换和数据库自助管理功能。

OceanBase4.3 发布,实时分析数据库领域的最强六边形战士?
OceanBase4.3 发布,实时分析数据库领域的最强六边形战士?

列式存储引擎,秒级实时分析,OceanBase 4.3 打造超强 TP/AP 一体化数据库。

致敬数据库大师,有28岁英年早逝,有80岁还重新创业
致敬数据库大师,有 28 岁英年早逝,有 80 岁还重新创业

从 1960s 到现在,数据库技术经历了多层变革,这里面是很多数据库领域工程师的深厚沉淀,也涌现了很多图灵奖的大师。

通往 AGI 之路,数据系统还需挑战哪些物理极限?
通往 AGI 之路,数据系统还需挑战哪些物理极限?

分布式 Data Warebase 是性能、正确性、实时性这三个业务核心需求的必然推论,它不是一个发明,而是一个发现。

分布式 Data Warebase——探索数据系统物理极限 | QCon
分布式 Data Warebase——探索数据系统物理极限 | QCon

了解数据领域最新发展趋势;如何借助新一代数据系统更好地提升业务价值;了解 AI 时代应当搭建什么样的数据底座

边缘上的关系型数据库:Cloudflare如何运维分布式PostgreSQL集群
边缘上的关系型数据库:Cloudflare 如何运维分布式 PostgreSQL 集群

本文探索了 Cloudflare 的分布式 PostgreSQL 集群,学习跨区域架构如何确保韧性。

四个问题搞懂银行数据团队如何打造数据体系
四个问题搞懂银行数据团队如何打造数据体系

数据团队就像是一个数据中台,能够全面贯穿整个组织的数据流。

蚂蚁安全领域智能化数据治理及新资产建设与探索|ArchSummit
蚂蚁安全领域智能化数据治理及新资产建设与探索|ArchSummit

人工智能的巨大突破对社会发展产生了重大的影响,使 AI 技术得以更普遍地下沉到更多的应用场景,AI 将驱动各行各业“质变”,高品质、多样性、大规模的智能数据集建设是 AI 技术应用竞争关键要素之一,在建设大规模数据集过程中,E 级别的安全数据资产必将带来高昂成本支出、及各种质量风险隐患,通过安全生产、表治理、存储与计算治理、平台治理、以及分级存储、智能调度等新技术手段降本增效,有效治理表量级 50%、存储与计算优化超 40%,年度节约成本近亿元。

钱大妈生鲜如何利用 CCR 实现 Apache Doris 集群读写分离
钱大妈生鲜如何利用 CCR 实现 Apache Doris 集群读写分离

Apache Doris 跨集群复制(CCR) 功能的引入,为钱大妈带来了显著的收益。

数据传输效率实现百倍飞跃,Apache Doris现已支持 Arrow Flight SQL 协议
数据传输效率实现百倍飞跃,Apache Doris 现已支持 Arrow Flight SQL 协议

为提供更高效的数据传输方案,Apache Doris 在 2.1 版本中基于 Arrow Flight SQL 协议实现了高速数据传输链路,使得数据传输性能实现百倍飞跃。

面向数据库的操作系统:80 岁的 PostgreSQL 之父宣布推出 DBOS Cloud
面向数据库的操作系统:80 岁的 PostgreSQL 之父宣布推出 DBOS Cloud

DBOS 的创建者最近推出了 DBOS Cloud,这是一个为 TypeScript 开发人员量身定制的事务性无服务器应用程序平台。

小米下一代 Data AI 资产管理实践
小米下一代 Data AI 资产管理实践

7 个数据平台,1 套元数据体系,小米基于 Gravitino 的下一代资产管理实践

中小银行数据治理做不好,是问责机制和考评绩效体系的“锅”?
中小银行数据治理做不好,是问责机制和考评绩效体系的“锅”?

中小银行业务粗放发展所带来的数据质量差的问题,导致数据不能有效成为新生产要素发挥关键作用。

顶尖数据团队都是如何开展数据体系搭建工作的? | 《超级连麦.数智大脑》
顶尖数据团队都是如何开展数据体系搭建工作的? | 《超级连麦. 数智大脑》

为了实现从数据采集、分析、到管理决策的全流程服务,让数据资源转变为数据资产,越来越多的企业加紧成立数据相关部门,希望实现对数据资产全生命周期的持续运营和价值挖掘。然而,对于国内很多非互联网企业而言,过去并未设立专门的数据团队,团队建设和管理具体如何展开?企业数据体系搭建工作又从哪些方面着手?如何让数据能够有效闭环到业务场景,为企业带来切实的商业价值?这一系列问题困扰着众多企业。

京东中台化底层支撑框架技术分析及随想

本文大约 1.7 万字,阅读需要 13 分钟。

中国信通院铸基计划年度大会成功举办,10+行业头部企业分享数字化转型实践
中国信通院铸基计划年度大会成功举办,10+ 行业头部企业分享数字化转型实践

数字经济发展速度之快、辐射范围之广、影响程度之深前所未有。

云原生数据库下一站:像 MySQL 一样流行
云原生数据库下一站:像 MySQL 一样流行

随着数据的爆发式增长和业务多元化发展,传统集中式数据库已无法满足应用场景需求。

硬件成本降低80%、OceanBase在58同城的落地实践
硬件成本降低 80%、OceanBase 在 58 同城的落地实践

因为业务种类繁多,很难找到一款数据库同时满足所有业务场景的要求,这是不少企业在数据库选型时的痛中之痛。

OceanBase在网易游戏的技术实践
OceanBase 在网易游戏的技术实践

网易游戏引入 OceanBase 已近半年,总体表现非常稳定,未出现任何性能抖动和同步延迟问题,有效解决了业务痛点。

Apache Doris 如何基于自增列满足高效字典编码等典型场景需求
Apache Doris 如何基于自增列满足高效字典编码等典型场景需求

自增列的实现,使得 Apache Doris 可以在处理大规模时展示出更高的稳定性和可靠性。

兼容 Presto、Trino、ClickHouse、Hive 近 10 种 SQL 方言,Doris SQL Convertor 解读及实操
兼容 Presto、Trino、ClickHouse、Hive 近 10 种 SQL 方言,Doris SQL Convertor 解读及实操

越来越多用户与企业开始将 Apache Doris 作为统一的数据分析产品,以解决多组件带来的数据冗余、架构复杂、分析时效性低、运维难度大等问题。

网易湖仓管理系统 Amoro 进入 Apache 孵化器
网易湖仓管理系统 Amoro 进入 Apache 孵化器

“让湖仓不再成为互联网企业的专宠。”

Databend x CubeFS:面向未来的企业级云原生数据存储与分析
Databend x CubeFS:面向未来的企业级云原生数据存储与分析

用场景的丰富,企业面临着前所未有的数据存储挑战。大规模数据存储变得日常化,伴随着超大容量和快速变化的 I/O 需求,传统的存储解决方案已经难以满足企业对弹性、运维效率及总体拥有成本(TCO)的更高要求。这些挑战促使基于分布式架构的软件定义存储(SDS)

低代码编程语言NASL从设计到落地的闯关之路 | QCon
低代码编程语言 NASL 从设计到落地的闯关之路 | QCon

CodeWave 智能开发平台以 NASO 为核心编程语言,通过低代码开发、智能化设计和用户为中心的理念,致力于提供一种低门槛高上限的编程体验,同时通过自动化工具和嵌入式类型系统等方式解决了实现挑战,为用户提供了更便捷、高效的开发体验。NASO 的未来展望包括优化语言设计、支持专业程序员的需求、提高性能、支持中文化、推广标准化实施等方面,以及加速社区共建和开源化进程。

  • 用户头像
    关注

    InfoQ高级编辑

  • 用户头像
    关注

    越努力,越幸运

  • 用户头像
    关注

    暂无签名

    研发在云端,淘系云研发体系实践
    研发在云端,淘系云研发体系实践

    包续兵 | 阿里巴巴 前端技术专家

    立即下载
    MongoDB 开发者数据平台助力企业构建 AI 智能化应用

    郑如鹏 | MongoDB 高级解决方案架构师

    立即下载
    哈啰基于 Web Components 的跨技术栈组件库实践

    徐顺发 | 哈啰 前端技术专家

    立即下载
  • GMTC

    共 328 篇内容

  • Git

    共 100 篇内容

  • SQL

    共 154 篇内容