大数据

关注
收录了大数据频道下的 10226 篇内容
讲述数据获取、存储、管理、分析的方方面面,关注软件、实践、生态,挖掘最新的前沿技术,同时也思考大数据与AI和云计算的深度结合。
  • 全部
  • DataOps
  • 数据集成
  • DataMesh
  • 数据编织
  • 数据湖仓
  • 在离线混部
  • 实时计算
  • 其他
  • 全部
  • 文章
  • 视频
  • 话题
  • 电子书
开源云原生数据仓库 ByConity实测,开启开启数据仓库的新篇章
开源云原生数据仓库 ByConity 实测,开启开启数据仓库的新篇章

通过合理调整 distributed_max_parallel_size 和 max_memory_usage 的值,用户可以在保证查询性能的同时,避免资源过度消耗和查询失败的风险。ByConity 非常推荐,原生数据仓库搭建,ByConity 你值得拥有。

重磅!云器数据平台即日起免费开放,通用增量计算引擎首次面向全行业试用
重磅!云器数据平台即日起免费开放,通用增量计算引擎首次面向全行业试用

2025 年 1 月 15 日,云器科技举行了云器 Lakehouse 产品开放注册发布会。这标志着这家专注于数据基础设施的科技公司,正式向全球用户开放体验其创新的云湖仓产品。

深入了解 ByConity的BSP模式:云原生数据仓库的创新实践
深入了解 ByConity 的 BSP 模式:云原生数据仓库的创新实践

ByConity 的设计理念是简化联邦查询的复杂性,通过开源的方式提供一个灵活、高效的解决方案。同时,它与现有的开源大数据生态系统(如 Apache Arrow、Apache Iceberg)紧密集成,增强了其易用性和扩展性

Apache Doris 创始人:何为“现代化”的数据仓库?
Apache Doris 创始人:何为“现代化”的数据仓库?

Apache Doris 目前 GitHub Stars 已近 13,000,社区的贡献者达到近 670 名,平均每月活跃贡献者超过 120 名。这一成就使其超越了 Spark、Kafka 等项目。

AI 信创与湖仓一体化,2024 年数据库&湖仓发展与展望
AI 信创与湖仓一体化,2024 年数据库 & 湖仓发展与展望

展望未来,我意识到,尽管数据库行业正面临明显的瓶颈,湖仓领域却蕴藏着无尽的潜力,而 AI 的崛起将进一步提高从业门槛。

Apache Iceberg 赢得未来:2025 年如何前进
Apache Iceberg 赢得未来:2025 年如何前进

数据工程的未来已经到来,而它正是 Iceberg。

共探数据可信流通时代的密态新算力|走进隐语年度嘉年华精彩现场
共探数据可信流通时代的密态新算力|走进隐语年度嘉年华精彩现场

第二届隐语开源社区嘉年华成功举办,其聚焦数据可信流通,会上发布社区年度报告,其规模与影响力增长显著。各方探讨密态计算等技术,强调数据安全合规及隐私计算应用,还分享了金融等领域成果与人才培养经验,推动数据要素技术创新发展。

ByConity :深入探讨ELT和bsp 模式应用实例
ByConity :深入探讨 ELT 和 bsp 模式应用实例

ByConity 是一个先进的数据集成与处理平台,专注于提供高效、灵活的 ELT(Extract, Load, Transform) 能力。它致力于通过简化数据管道设计和优化数据处理流程,帮助企业应对复杂的大数据处理需求,实现更快的数据传输速度、更高的处理能力以及更低的运维成本。

ByConity ELT实战:云原生数据仓库的高效数据处理与性能优化探索
ByConity ELT 实战:云原生数据仓库的高效数据处理与性能优化探索

随着大数据技术的发展,实时数据仓库和离线数据仓库在企业数据分析中的重要性日益增加。为了满足企业对数据处理性能和效率的多样化需求,ByConity 作为一款开源云原生数据仓库,提供了一个高效的解决方案,特别是在 ELT(Extract, Load, Transform) 任务的执

ByConity BSP 解锁数据仓库新未来
ByConity BSP 解锁数据仓库新未来

在现代数据分析场景中,实时数仓与离线数仓各有侧重:实时数仓注重低延迟的数据入库与即时分析能力,而离线数仓则强调复杂任务的稳定执行及高效的内存管理。为满足用户多样化的数据需求,ByConity 作为一款开源云原生数据仓库,提供了全新的 BSP 模式,大幅提

从 CephFS 到 JuiceFS:同程旅行亿级文件存储平台构建之路
从 CephFS 到 JuiceFS:同程旅行亿级文件存储平台构建之路

同程旅行因 CephFS 运维难度大,转向 JuiceFS 构建存储平台,覆盖多场景,规模可观。文章介绍了 JuiceFS 选型原因、平台化建设、高可用集群部署、落地收益、挑战与优化,还提及未来展望,包括开发分布式 KV 存储系统等。

数据处理不再是“脏活累活”,听听开发者们怎么说?
数据处理不再是“脏活累活”,听听开发者们怎么说?

一直以来,数据处理都被视作“脏活累活”,从数据的收集、清洗、转换,再到存储、分析,每个步骤都可能遇到各种挑战,繁琐且耗时。

Apache Doris 创始人:何为“现代化”的数据仓库?
Apache Doris 创始人:何为“现代化”的数据仓库?

Apache Doris 创始人 & PMC 成员马如悦在开场演讲中,围绕“现代化数据仓库”这一主题,指出 3.0 版本是 Apache Doris 研发路程中的重要里程碑,他将这一进展总结为“实时之路”、“统一之路”和“弹性之路”,

数势科技指标平台, 让数据产生最大价值。
数势科技指标平台, 让数据产生最大价值。

近来,指标体系和指标平台的重要性正被越来越多的业界同仁所认可。作为行业领先的数据智能产品提供商,数势科技最早推出了统一指标开发管理平台这一突破性产品(2021 年获得软著),并首家完成了中国信通院数据指标管理平台技术要求专项测试,此外还出版了行业首本指标体系与指标平台的专著,并在三年之间内成功交付了众多行业头部客户,积累了丰富的产品落地经验,成功交付的客户量为业内最多。

京东大数据治理探索与实践 | 京东零售技术实践
京东大数据治理探索与实践 | 京东零售技术实践

在当今的数据驱动时代,数据作为关键生产要素之一,其在商业活动中的战略价值愈加凸显,京东也不例外。

第二届隐语开源社区嘉年华活动报名开始
第二届隐语开源社区嘉年华活动报名开始

探索 AI 时代下,数据要素的无限可能。

揭秘 JDQ 限流架构:实时数据链路的多维动态带宽管控|京东零售技术实践
揭秘 JDQ 限流架构:实时数据链路的多维动态带宽管控|京东零售技术实践

在数字化转型的浪潮席卷之下,大数据和云计算技术已成为企业创新和发展的关键驱动力。尤其是以京东为代表的电商平台为例,其日常运营中持续生成海量数据,涵盖实时交易记录、点击曝光统计及用户行为轨迹等,这些数据对精准业务决策、深化用户体验优化等方面具有重要意义。

2024腾讯云大数据年度干货合集2024腾讯云大数据年度干货合集
2024 腾讯云大数据年度干货合集

腾讯云大数据 2024 年度技术合集强势来袭!从 RAG 到数据湖仓,再到 BI 引擎,热门技术应有尽有。更有零售、教育、金融等行业的精选案例,以及权威的资质认证。

降本增效神器?Lakehouse是怎么在大厂里火起来的
降本增效神器?Lakehouse 是怎么在大厂里火起来的

Lakehouse 会是数据分析的新标配吗?

“卷王”一次上架百余款大模型,改写游戏规则
“卷王”一次上架百余款大模型,改写游戏规则

新产品与技术的更新不应是“拿着锤子找钉子”,而是去繁就简,实用至上。

亚马逊云科技三大AI产品线齐更新:颠覆性变革成为新常态,快速创新是生存法则
亚马逊云科技三大 AI 产品线齐更新:颠覆性变革成为新常态,快速创新是生存法则

亚马逊云科技大动作🤖!AI 飞跃!

生成式 AI 项目越来越多,但数据管理要怎么才能高效进行?
生成式 AI 项目越来越多,但数据管理要怎么才能高效进行?

未来 5 到 10 年,所有应用都会是 AI 驱动的应用。

零售银行全渠道营销策略设计与平台架构实践
零售银行全渠道营销策略设计与平台架构实践

银行如何构建无缝的客户体验?

Cloudflare 支持短期 SSH 访问,无需生成 SSH 凭证
Cloudflare 支持短期 SSH 访问,无需生成 SSH 凭证

本文提到了 Cloudflare 集成 BastionZero,支持短期 SSH 访问,用临时证书替代长期密钥,简化管理并增强安全性,实现像管理应用程序一样的 SSH 访问控制。

字节跳动开源云原生数据仓库ByConity有奖众测,邀你体验完整的数仓能力
字节跳动开源云原生数据仓库 ByConity 有奖众测,邀你体验完整的数仓能力

为了让更多的开发者深入了解并体验 ByConity bsp 模式的能力,InfoQ 和 ByConity 社区联合举办“ByConity 有奖众测活动”,邀请广大开发者参与 ByConity bsp 模式在离线数仓场景的实际测试,通过亲身实践来感受其带来的高效与便捷。

Meta 利用强化学习优化数据中心的可持续性
Meta 利用强化学习优化数据中心的可持续性

本文提到了 Meta 使用强化学习优化数据中心环境控制,减少能源和水消耗,应对气候变化。试点地区实现能耗降低 20%,用水量降低 4%。

存算分离的过去、现在和未来
存算分离的过去、现在和未来

存算分离架构,作为数据处理领域的一个重要概念,从其最初的雏形到如今广泛应用,经历了多次迭代和变革。

兼顾高性能与低成本,浅析 Apache Doris 异步物化视图原理及典型场景
兼顾高性能与低成本,浅析 Apache Doris 异步物化视图原理及典型场景

面对有限的计算资源,成本及性能如何平衡,严格的资源管控也显得尤为重要

    架构十年 - 施耐德电气数字化服务的演进之路和个人收获
    架构十年 - 施耐德电气数字化服务的演进之路和个人收获

    谭坦 | 施耐德电气 数字化服务/首席架构师

    立即下载
    组件化预测系统在供应链行业的实践

    伍斌杰 | 京东物流 算法架构师

    立即下载
    MatrixOne 在 SaaS 企服领域的应用场景解读

    邓楠 | 矩阵起源 产品总监

    立即下载