下载 InfoQ App >
随时随地获取最新技术资讯
6 月
26 - 27
2026
AICon人工智能开发与应用大会|上海
多智能体协同|模型推理优化|AI 原生数据架构|可信 AI 与治理|具身智能与物理 AI
🔥9折优惠立减580元!
8 月
21 - 22
2026
AICon人工智能开发与应用大会|深圳
Agentic AI|Agentic UI|AI 工业化落地|AI 工程化与极致效能
🔥8折优惠立减1160元!
10 月
22 - 24
2026
QCon全球软件开发大会|上海
Al Agent |Vibe Coding|智能可观测|推理基建|模型攻防|AI x创造力
🔥8折优惠立减1360元!
4月16
- 6月30
2026
代码通过即拿奖💵
OpenCloudOS 40+ 超热门 AI 工具等你来贡献
⬆️火速认领,先到先得

演讲人:吴俊杰
演讲人:马可薇、王搂、郝栩彬
演讲人:顺丰集团CIO 刘潭仁、深信服科技CIO 宋东林、极客邦创始人&CEO 霍太稳

企业聘用 FP&A 团队,是为了分析经营表现、检验计划的合理性,并帮助管理者做出决策。但很多时候,这项工作中相当大的一部分却耗在了流程性事务上:从 ERP 提取实际数据、统一会计科目表、映射至预算模型、核对入账时点与重分类,以及在每次关账时重新搭建同一份工作簿。

MiMo Code 现在暴露出了一批早期产品问题

大模型是否会沦为有量无价的卖水生意、Scaling Law 是否已经失效、开源闭源差距是否只剩 6 个月,三位嘉宾从学术研究、技术创业和产业落地三个维度给出了集体反驳与独家判断。

Azure API Management 上线统一模型 API,实现多后端模型接口统一适配;内容安全防护拓展至 MCP 调用与智能体通信场景,同时升级词元指标,支持跨厂商统计多类型词元消耗。

最好的 Agent 平台,必须建立在最好的数据平台之上。

Uber 近日介绍了一套高吞吐量账本处理系统,用于解决其分布式账务基础设施中单个账户持续遭遇高并发写入的问题。这类问题通常出现在大量更新请求集中落到同一个账户上的场景中。当更新频率持续升高时,传统“一次请求对应一次事务”的处理模式很快会触及性能瓶颈。根据 Uber 工程团队介绍,这套新系统在满足严格一致性和审计要求的前提下,能够实现单个账户每秒 30 次以上的更新处理能力。

奇遇旧金山收官篇,我们来到 Snowflake 硅谷总部,在真实的工作现场里,重新理解 AI 时代的 Builder:技术如何被构建,价值如何被验证,连接如何让创新继续发生。

本文分析了纯向量检索架构 RAG 流程存在的局限性,并介绍了内部全量检索应用如何借助倒数排名融合(RRF) 整合 BM25 与向量检索结果来优化检索方案。


精选火山引擎视频云支撑抖音在世界杯、亚运会等大型赛事直播中的关键技术实践,围绕低时延直播、视频编码、画质优化、弹性分发、沉浸体验与互动创新等方向,呈现面向世界杯周期的能力升级路径,帮助客户在更高清、更稳定、更智能、更具参与感的观赛体验中获得新的增长空间。

Snowflake Summit 26 第二天,奇遇团最直观的感受是:AI 正在从宏大愿景,走进真实的数据工程与业务现场。

当前大模型推理受限于非均匀数据分布与同构算力架构的严重错配,导致存储冗余、精度浪费与访存瓶颈。本报告提出一套面向大模型推理的跨层协同优化方案。

最积极采用 AI 的公司,每月每位员工在 AI 工具上花费 7500 美元,约合 50807 元人民币。

近日,OpenAI 已向美国证券交易委员会(SEC)秘密提交了 IPO(首次公开募股)申请。

未来移动 GPU 的一个重要发展方向——从单纯提升图形算力,转向图形计算与神经计算协同工作。

微软在 Build 2026 大会推出 Microsoft Foundry 新功能,该平台可助力 AI 智能体落地生产环境,本次更新补齐了搭建生产级智能体所需的全套能力,并非仅新增模型接口。

传统的产品、运营、研发协作模式正在经历前所未有的效能考验。

“端到端的四维生成模型,是我们理想中的终极形态。”

当 Agent 开始吞噬企业软件,一场“Token 大爆炸”已无法避免。

本期《C 位面对面》,InfoQ 极客传媒总编辑 & 总经理王一鹏对话华为数据存储产品线副总裁吴俊杰,一起聊聊,当 Token 开始成为新的“货币”之后,AI 数据基础设施正在发生哪些变化。

在 Snowflake Summit 2026 现场,奇遇团捕捉到一个愈发清晰的信号:企业 AI 的下一站,正在全面走向 Agentic Enterprise。 这不再是单一模型能力的比拼,而是企业数据、AI 模型、业务应用与 Agentic Control Plane 的深度协同。在这场聚焦“Making AI Real for Business”的盛会上,中国技术专家与硅谷科技巨头在架构路线上完成了一次战略方向互证。 带着国内企业 AI 落地的真实问题和挑战,他们在现场交流中碰撞出了哪些新知与洞察?从高密度逛展到开幕 Keynote,奇遇团的现场探访正式开启。

6 月 8 日 InfoQ 迎来二十周年,本文精选梳理其早期关注的技术与实践,分析它们当下所处的应用阶段,并预测未来五至十年的发展走向。

腾讯、大晓机器人、极佳视界三位世界模型一线负责人同台对谈,拆解世界模型爆发背后的关键技术突破。

隔壁已经欢呼,自己的直播还在回传球——这是无数球迷在大型赛事中最怕遇到的瞬间。

Rocicorp 推出通用 Web 同步引擎 Zero 1.0 首个稳定版,已全面支持 Zero API 并将持续维护,后续破坏性变更会极少且影响有限。

利用国产算力底座支撑起千亿级参数模型的高效训推已成为工业界关注的核心课题。

亚马逊云科技推出开源适配器 ExtendDB,兼容 DynamoDB,现阶段支持 PostgreSQL 作为存储后端。

本次演讲将聚焦于 Omni Cache 的 DRAM-Centric KV 管理架构设计。传统的 PagedAttention 架构将 KV cache 静态预分配在 HBM 中,导致 KV 存储与激活张量竞争有限的显存资源。

Cloudflare 计费管道卡顿源于 ClickHouse 查询规划阶段的锁竞争,团队通过修改锁类型、取消分片列表复制、优化分片过滤等补丁修复问题。

OpenAI 公布 Codex 编码智能体所用的 Windows 沙盒架构的技术细节。

“你不该再给编程 Agent 写提示词了”