下载 InfoQ App >
随时随地获取最新技术资讯
4 月
16 - 18
2026
QCon全球软件开发大会|北京
Agent 工程/架构/可观测/安全|算力优化|技术债治理|多模态|AI 原生基础设施
🔥8折优惠截止日期:3月13日
6 月
26 - 27
2026
AICon人工智能开发与应用大会|上海
多智能体协同|模型推理优化|AI 原生数据架构|可信 AI 与治理|具身智能与物理 AI
🔥8折优惠火热进行中
8 月
26 - 27
2026
AICon人工智能开发与应用大会|深圳
Agentic AI|Agentic UI|AI 工业化落地|AI 工程化与极致效能
🔥8折优惠火热进行中
3 月
10 - 13
2026
Snowflake AI数据云
DISCOVER AI 技术实践周,预约通道已开启!
👉点击查看详情

演讲人:霍太稳、陈葆立、李德铠
演讲人:王一鹏 、杨勇、郭松柳
演讲人:张鑫、Kevin

近期,Google Cloud 宣布在云监控服务中全面支持 OpenTelemetry 协议(OTLP),此举标志着其在跨观测技术栈统一遥测数据采集方面迈出了重要一步。

AWS 发布 Agent Plugins for AWS 开源仓库,旨在为 AI 编程智能体提供在 AWS 上进行应用架构设计、部署与运维的专项能力。

Ztopia——一个以 Milvus 向量数据库为记忆基础、以 Claude Code 为推理引擎的企业级 Agent 系统,将分散的企业数据统一纳入 Agent 的长期记忆体系

谷歌云显著减少了为 Kubernetes 集群配置新节点池所需的时间。

GitHub 发布年度开源趋势报告,帮助开源社区为新一年做好规划。

谷歌与 MIT 研究人员提出一种可用于扩展多智能体系统的预测框架。

阿迪达斯对其数据平台的基础设施交付方式进行了全面改革,从集中式的 IaC 模型转向去中心化模式。

极客邦科技发起的“OpenClaw 中国行”活动。

Uber 工程团队对其数据复制平台做了全面升级,现在每天可以在混合云和本地数据湖之间移动数以 PB 计的数据,解决了由于工作负载迅速增长而引起的扩展挑战。

连“说明书”都 Codex 自己写的

本文整理自北京邮电大学副教授、博士生导师徐梦炜博士在 2025 年 QCon 全球软件开发大会(上海站) 的分享“终端大模型操作系统的架构、优化与展望”。徐老师介绍了团队在大模型操作系统设计和优化方向的思考和尝试,包括 GUI/API 终端智能体构建、面向 NPU 的端侧大模型推理优化加速等。

AI 从模型能力竞争,进入规模化推理能力竞争的新阶段。随着大模型在企业级场景中的落地,推理系统的性能、成本与资源利用率,正成为决定 AI 商业化成败的关键因素。在这一过程中,存储作为 AI 基础设施核心支撑环节,成为释放 AI 算力、重构推理效率结构的核心能力。

Uber 开源了 uForwarder,这是一款基于推送模式的 Kafka 消费者代理,旨在处理每日数万亿条消息与 PB 级别的数据。该系统引入了上下文感知路由、队头阻塞缓解、自适应自动重平衡以及分区级延迟处理,以提升大规模事件驱动微服务的可扩展性、工作负载隔离能力与硬件使用效率。

本文系统剖析大模型记忆工程的核心技术:记忆分层管理、多粒度调度、可信更新与安全治理,并展示这些技术在金融、工业、知识管理等业务中的应用效果。通过对架构设计、实现细节和案例经验的讲解,帮助开发者与架构师全面理解如何构建具备长期留存与动态调度能力的“有记忆的 AI”,以及它在未来产业智能化演进中的角色与挑战。

经过 15 个里程碑版本的迭代,Eclipse 基金会正式发布了 GlassFish 8.0,带来了对虚拟线程的支持、增强的应用安全能力以及改进的数据访问功能。GlassFish 8.0 是 Jakarta EE 11 的兼容实现。Java Champion、OmniFish 联合创始人 Ondro Mihályi 就 GlassFish 8.0 接受了 InfoQ 的采访。

“真不敢相信旧金山湾区居然有人要花 6000 美元请人上门安装 OpenClaw。”

打破传统研发模式,构建以统一语义层 UModel 为底座、以数据飞轮为驱动的 Agent Engineering 新范式

谷歌研究院通过对 180 种智能体配置进行对照评估,试图解答如何设计智能体系统以实现最优性能的问题。研究团队由此得出了他们所称的“AI 智能体系统首批定量扩展原则”,结果表明,多智能体协同并不能稳定提升效果,甚至可能降低性能。

“我们不怎么写东西,我们直接拿东西出来给你看。”

Leapwork 近期发布的最新研究显示,尽管人们对 AI 驱动的软件测试信心快速增长,但准确性、稳定性和持续的人工投入,仍是团队愿意在多大程度上信任自动化的决定性因素。

OpenAI 在硬件战略方面做出重大调整,推出 GPT-5.3-Codex-Spark 模型。

本次演讲将深入探讨多模态模型的快速进化推动 AI 应用场景扩充、AI 课程和 AI 陪练领域的一些应用等相关内容

MySQL 更改了管理外键约束和级联操作的方式。从 MySQL 9.6 开始,外键验证和级联操作将由 SQL 层处理,而不是 InnoDB 存储引擎。

莫属。它是怎么变聪明的,它已经走到了哪里,它接下来会怎样改变人类社会,以及一旦失控,终局可能有多可怕。

应用部署和生命周期管理工具 Argo CD 发布 3.3 版本,达到了一个新的里程碑。此次发布扩展了这个广受欢迎的 GitOps 持续交付工具的能力,同时解决了运维人员长期面临的几个痛点。

本次分享展示如何通过多 Agent 协同和分阶段优化提升 AI 助手的决策能力和用户体验,推动汽车之家 AI 助手从单一功能向智能生态演进

Vercel 发布开源存储库 react-best-practices,其中包含 40 多条针对 React 和 Next.js 应用程序的性能优化规则。

2026 年将是中国 AI 从“技术突破”走向“工程落地”的关键之年。