AI&大模型

关注
收录了AI&大模型频道下的 12775 篇内容
关注 AIGC,跟踪科技公司、科研机构和IT产业在人工智能方向的最新动态,挖掘人工智能技术应用场景和商业化落地案例,重点关注该技术在金融、教育、医疗、交通、智慧城市等方向的应用。
  • 全部
  • 自动驾驶
  • 计算机视觉
  • 生成式 AI
  • AI 工程化
  • 机器学习/深度学习
  • 自然语言处理
  • 芯片&算力
  • 其他
  • 全部
  • 文章
  • 视频
  • 话题
  • 电子书
北森1.8亿元拿下明星创企,将向近万家企业部署AI Agent
北森 1.8 亿元拿下明星创企,将向近万家企业部署 AI Agent

这是 2025 年中国 SaaS 行业的并购首单。

卖身、豪赌Killer App的AI 厂商:被“吊”麻了,明年咋活?
卖身、豪赌 Killer App 的 AI 厂商:被“吊”麻了,明年咋活?

整个行业的风向变得更加微妙起来了。

AI与软件产业的明天:中美视角的年度技术观察&前瞻 |InfoQ《极客有约》
AI 与软件产业的明天:中美视角的年度技术观察 & 前瞻 |InfoQ《极客有约》

InfoQ 在 2024 年结束、2025 年即将到来之际,应广大读者要求,期望能够邀请到导师们,通过分享您对 AI 时代下软件行业发展趋势及开发者职业成长路径的见解和心得,帮助我们开发者群体掌握未来技术发展趋势,树立个人技术竞争力,从而助力每一位软件工程师在未来的职业道路上走得更远、更稳。

大语言模型应用开发框架 Eino 正式开源!
大语言模型应用开发框架 Eino 正式开源!

Eino 基于明确的“组件”定义,提供强大的流程“编排”,覆盖开发全流程,旨在帮助开发者以最快的速度实现最有深度的大模型应用。

极客说|Phi-4 模型的 4 位量化与 vLLM 高速推理
极客说|Phi-4 模型的 4 位量化与 vLLM 高速推理

的模型参数量是 14B,这使它在推理的时候比较耗费内存。因此如果我们想要在边缘端运行,需要对它进行量化。

RAG 的未来,走向繁荣、重塑还是消亡?
RAG 的未来,走向繁荣、重塑还是消亡?

百度灵医大模型底座技术负责人夏源、Hugging Face Machine Learning Engineer 尹一峰、火山引擎技术专家田昕晖、阿里云高级技术专家费跃,共同探讨 RAG 技术在不同领域中的应用维度。

跟UML创始人、IBM院士Grady Booch聊软件工程50年演变:从传统编码到大模型时代
跟 UML 创始人、IBM 院士 Grady Booch 聊软件工程 50 年演变:从传统编码到大模型时代

整个软件工程的发展史,就是一段抽象层次不断提升的历史。我们如今正在见证又一个抽象层次的出现,它为我们带来了极其强大的框架,帮助我们以此为基础构建新的系统。

CIKM 2024 | 京东电商搜索:深度强化学习的探索与落地
CIKM 2024 | 京东电商搜索:深度强化学习的探索与落地

在京东零售这样的电商平台上,搜索领域是最大的流量场域,承担着提升自然流量可运营能力的重要任务。如何通过有效的流量调控系统来增强商家对自然流量的运营能力,成为平台和商家共同关注的焦点。

2024 京东零售技术年度总结
2024 京东零售技术年度总结

每一次回望,都为了更好地前行。

中国软件重塑的关键一年:这11大领域迎来了自己的“ChatGPT时刻” | 年终盘点
中国软件重塑的关键一年:这 11 大领域迎来了自己的“ChatGPT 时刻” | 年终盘点

大模型只投入也没杀手级应用,2025 年你跟吗?国内开源社区所存在独特问题:部分开源、放收款码,专家们怎么评价?Rust 火得像邪教,明年我们学不?你是否处于我们盘点的这 11 大领域之中,是否错过了最大风口?......InfoQ 一年一度的盘点,不仅是一份行业指南,更是一份对未来趋势的预测。

大模型搜广推,“新瓶装旧酒;还是“范式的革新”?
大模型搜广推,“新瓶装旧酒;还是“范式的革新”?

百度主任架构师、信息流推荐架构负责人颜林担任主持人,与百度资深工程师施刘远、京东算法总监张泽华、枫清科技(Fabarta)AI 负责人张红兵、火山引擎边缘智能技术负责人谢皓,共同探讨大模型技术在应用架构中的创新与实践。

科大讯飞发布首个基于全国产算力的深度推理大模型X1,率先落地教育、医疗
科大讯飞发布首个基于全国产算力的深度推理大模型 X1,率先落地教育、医疗

科大讯飞与华为合作攻克了训练推理强交互、高吞吐推理优化以及国产算子优化等难题。

RTE 与 AI 共舞:Voice Agent 点燃生态新引擎
RTE 与 AI 共舞:Voice Agent 点燃生态新引擎

本篇文章围绕 RTE 与 AI 生态融合下的用户新体验,Voice Agent 的新生态展开描述,并在结尾提出五大问题以供读者思考。

详解veImageX助力卓特视觉智能、高效生成设计素材
详解 veImageX 助力卓特视觉智能、高效生成设计素材

设计素材行业为设计师和创意工作者提供丰富的视觉和创意资源。数字媒体和互联网的迅猛发展,促使这一行业市场规模不断扩大,用户对设计素材的个性化和定制化需求与日俱增。

开源首秀就放大招!MiniMax重磅更新两款大模型,业内首次大规模实现线性注意力机制
开源首秀就放大招!MiniMax 重磅更新两款大模型,业内首次大规模实现线性注意力机制

最近一段时间,中国大模型频频“刷屏”。

领跑AI To C  夸克品牌焕新“2亿人的AI全能助手”
领跑 AI To C 夸克品牌焕新“2 亿人的 AI 全能助手”

1 月 15 日,阿里智能信息事业群旗下夸克升级品牌 Slogan—“2 亿人的 AI 全能助手”,亮出加速探索 AI To C 应用的全新业务态势。第三方数据显示,夸克用户规模持续保持高速增长,并领跑 AI 应用赛道,其中 00 后年轻用户占比超过一半。

谷歌推出全新的 AI 扩展现实平台 Android XR
谷歌推出全新的 AI 扩展现实平台 Android XR

谷歌推出全新 AI 扩展现实平台 Android XR,它基于 Android 系统,整合 Gemini,利用诸多关键组件。应用程序可实现虚拟与现实共存,谷歌还发布了 SDK 方便开发,有 Jetpack XR 等关键部分,且有自己的 Play 商店。目前仅预览版,三星 2025 年将发首款设备,感兴趣可申请访问。

RTE 和 AI 融合生态洞察报告 2024RTE 和 AI 融合生态洞察报告 2024
RTE 和 AI 融合生态洞察报告 2024

本报告专注于探索如何利用实时互动技术与 AI 相结合来提升用户体验,以及社区是如何帮助 Voice Agent 生态建设和发展的。

为异构推理做好准备:次世代 RTP-LLM 推理引擎设计分享
为异构推理做好准备:次世代 RTP-LLM 推理引擎设计分享

由于初版 rtp-LLM 是基于 nvidia 的开源库开发,在设计上和 cuda 硬件强耦合,无法摆脱对 nvidia gpu 的依赖,因而不能支持 cuda 以外的硬件设备,这样的框架显然难以支持未来更加丰富的硬件生态。而在硬件问题之外,随着业务复杂度的增长,越来越多的缺陷也被暴露出来。因此,我们本着以硬件接口为第一公民的思想,重构了 rtp-LLM 的模型推理逻辑。本文将从以下几个方面,结合源代码中的模块介绍 rtp-LLM 在计算部分的的设计思想。

2024年中国大模型行业应用优秀案例白皮书2024年中国大模型行业应用优秀案例白皮书
2024 年中国大模型行业应用优秀案例白皮书

为帮助厂商及用户了解大模型在各行业的应用情况、厂商表现以及优秀的行业实践标杆,沙利文对中国各行业大模型应用案例进行了深度分析。

2024技术人年度总结丨智能化重构未来交互
2024 技术人年度总结丨智能化重构未来交互

本文基于 InfoQ 与 Dell 联合推出的「技术人年度总结」进行整理、提炼,旨在探讨智能化的应用现状、技术演进以及未来可能。

比帮你写代码更爽的是:让Agent来打工|对话 AI 原生《云智实验室》
比帮你写代码更爽的是:让 Agent 来打工|对话 AI 原生《云智实验室》

大模型演进至今,大家一直在等待一个杀手级应用,Agent 的出现正在让这一构想成为可能。

比帮你写代码更爽的是:让Agent来打工
比帮你写代码更爽的是:让 Agent 来打工

大模型演进至今,大家一直在等待一个杀手级应用,Agent 的出现正在让这一构想成为可能。Agent 能将大模型的强大能力与实际业务场景结合,实现更加智能化和个性化的应用。百度智能云千帆 AppBuilder 作为基于大模型的企业级 AI 原生应用开发工作台,全面覆盖从创意到部署的高效 AI 应用开发需求,精准解决大模型技术向实际应用转化的“最后一公里”难题。

焱融全闪 F9000X 性能再创新高,全面释放大规模 AI 计算效能
焱融全闪 F9000X 性能再创新高,全面释放大规模 AI 计算效能

新年伊始,焱融科技再次在存储性能领域取得突破。的网络带宽聚合。倍。30%。时代的全面到来。迎来了飞速发展的黄金时期,不断刷新着能力边界。

这群00后“杀疯”了!没靠资本、大学刚毕业狂赚7千万,TikTok助攻AI爆款应用出世
这群 00 后“杀疯”了!没靠资本、大学刚毕业狂赚 7 千万,TikTok 助攻 AI 爆款应用出世

有一群最小不过 17 岁的 00 后却另辟蹊径,自力更生创立出一批价值数百万美元的 AI 移动应用程序,其中不乏月用户在 10 万以上、年收入在 100 万至 500 万美元之间的应用。

Meta 提高了 Threads 的 iOS 性能
Meta 提高了 Threads 的 iOS 性能

Meta 为提升 Threads 的 iOS 性能,工程师通过定义 FIRE、TTNC、cPSR 等指标,测量启动速度、发布难易度等情况。如减小二进制文件大小、创建 SLATE 日志系统、引入 “草稿” 功能等,并采用 Swift 完全并发提升稳定性,有效减少用户缺陷报告,增强应用性能。

    智能协同高效的 UI 生产体系探索和实践
    智能协同高效的 UI 生产体系探索和实践

    任跃华 | 快手 前端工程师

    立即下载
    中国软件技术发展洞察和趋势预测报告 2023

    姜昕蔚 | InfoQ 研究总监兼首席分析师

    立即下载
    大模型落地到代码助手场景的探索实践

    汪晟杰 | 腾讯云 开发者产品中心/产品总监

    立即下载