下载 InfoQ App >
随时随地获取最新技术资讯
4 月
16 - 18
2026
QCon全球软件开发大会|北京
Agent 工程/架构/可观测/安全|算力优化|技术债治理|多模态|AI 原生基础设施
🔥8折优惠截止日期:3月13日
6 月
26 - 27
2026
AICon人工智能开发与应用大会|上海
多智能体协同|模型推理优化|AI 原生数据架构|可信 AI 与治理|具身智能与物理 AI
🔥8折优惠火热进行中
8 月
21 - 22
2026
AICon人工智能开发与应用大会|深圳
Agentic AI|Agentic UI|AI 工业化落地|AI 工程化与极致效能
🔥8折优惠火热进行中
3 月
10 - 13
2026
Snowflake AI数据云
DISCOVER AI 技术实践周,预约通道已开启!
👉点击查看详情

演讲人:霍太稳、陈葆立、李德铠
演讲人:王一鹏 、杨勇、郭松柳
演讲人:张鑫、Kevin

OpenAI 近日完成 1100 亿美元融资,亚马逊出资 500 亿美元,并成为其企业级智能体管理平台 Frontier 的独家第三方云分销商。

云原生计算基金会(CNCF)最近宣布,其开源的镜像和文件分发系统 Dragonfly 已经达到了毕业状态,这是 CNCF 项目生命周期中的最高成熟度级别。这一里程碑标志着 Dragonfly 已具备生产就绪性、广泛行业的采用以及在众多大型组织中对云原生基础设施的扩展,特别是在容器和 AI 工作负载方面,发挥了关键作用。

Agent 并非简单的功能模块,而是一种全新的计算实体

近日,GitHub 2025 年的 Octoverse 报告揭示了开发者可能没有意识到的一些事情。AI 编程助手不仅改变了开发者编写代码的速度,还影响了开发者最初选择的语言。

我们的系统架构会随着技术和开发实践的发展而变化,但我们实践架构的方式并没有跟上这种变化。

一位 Discord 工程师出于兴趣开发了一款 AI 安全工具。一夜之间,来自 Anthropic、亚马逊和 Shopify 的 25000 名工程师就开始使用它,这甚至在它正式发布之前。

MiniMax 收涨超 22%,总市值达 3826.4 亿港元。

AI,从公益装机到应用实战,从项目闪电秀到工具市集,再到和真正的开发者聊聊天,我们用一下午的时间帮你迈出第一步。

《人月神话》自 1975 年出版至今已逾半个世纪。这期间行业发生了翻天覆地的变化:硬件性能飞跃、编程语言迭代、开发环境升级、云计算普及,乃至如今大语言模型的出现。工具一直在变,但核心约束始终未变。

这一方案的核心思路是将安全策略执行从主机系统中剥离,直接下沉到基础设施硬件层,从而在不影响业务运行的情况下保护关键系统。

年化收入破 20 亿美元,Cursor 成最“吸金”AI 独角兽之一。

Cloudflare 重构了最火的前端项目,但整个项目仅花费约 1100 美元的 Token 费用。

这看上去更像是在给模型自己的不稳定再加一层补丁——而且这层补丁,还要再收一笔钱。

OpenAI 新模型不仅会自己用电脑,编程能力也拉满了

在这个基础上,OpenClaw 又把上下文处理抽象成可插拔的 Context Engine。

如果推进上市,它很可能成为美国科技史上规模最大的 IPO 之一。

1000 人工程组织如何真正落地 AI

鹅厂门口排队装“龙虾”,小米手机也掀 AI 安装潮

近期,Google Cloud 宣布在云监控服务中全面支持 OpenTelemetry 协议(OTLP),此举标志着其在跨观测技术栈统一遥测数据采集方面迈出了重要一步。

AWS 发布 Agent Plugins for AWS 开源仓库,旨在为 AI 编程智能体提供在 AWS 上进行应用架构设计、部署与运维的专项能力。

Ztopia——一个以 Milvus 向量数据库为记忆基础、以 Claude Code 为推理引擎的企业级 Agent 系统,将分散的企业数据统一纳入 Agent 的长期记忆体系

谷歌云显著减少了为 Kubernetes 集群配置新节点池所需的时间。

GitHub 发布年度开源趋势报告,帮助开源社区为新一年做好规划。

谷歌与 MIT 研究人员提出一种可用于扩展多智能体系统的预测框架。

阿迪达斯对其数据平台的基础设施交付方式进行了全面改革,从集中式的 IaC 模型转向去中心化模式。

极客邦科技发起的“OpenClaw 中国行”活动。

Uber 工程团队对其数据复制平台做了全面升级,现在每天可以在混合云和本地数据湖之间移动数以 PB 计的数据,解决了由于工作负载迅速增长而引起的扩展挑战。

连“说明书”都 Codex 自己写的

本文整理自北京邮电大学副教授、博士生导师徐梦炜博士在 2025 年 QCon 全球软件开发大会(上海站) 的分享“终端大模型操作系统的架构、优化与展望”。徐老师介绍了团队在大模型操作系统设计和优化方向的思考和尝试,包括 GUI/API 终端智能体构建、面向 NPU 的端侧大模型推理优化加速等。

AI 从模型能力竞争,进入规模化推理能力竞争的新阶段。随着大模型在企业级场景中的落地,推理系统的性能、成本与资源利用率,正成为决定 AI 商业化成败的关键因素。在这一过程中,存储作为 AI 基础设施核心支撑环节,成为释放 AI 算力、重构推理效率结构的核心能力。