AI&大模型

关注
收录了AI&大模型频道下的 13212 篇内容
关注 AIGC,跟踪科技公司、科研机构和IT产业在人工智能方向的最新动态,挖掘人工智能技术应用场景和商业化落地案例,重点关注该技术在金融、教育、医疗、交通、智慧城市等方向的应用。
  • 全部
  • 自动驾驶
  • 计算机视觉
  • 生成式 AI
  • AI 工程化
  • 机器学习/深度学习
  • 自然语言处理
  • 芯片&算力
  • 其他
  • 全部
  • 文章
  • 视频
  • 话题
  • 电子书
微软突发“封杀令”!全面禁止Cursor使用C、C++、C#扩展,开发者被迫回退版本
微软突发“封杀令”!全面禁止 Cursor 使用 C、C++、C#扩展,开发者被迫回退版本

过去没这么做,大概是因为没人把 VSCode 拿去 fork 并试图做成竞品。

开源方案之外的选择:阿里内部为设计打造的 AIGC 生产力平台 MuseAI
开源方案之外的选择:阿里内部为设计打造的 AIGC 生产力平台 MuseAI

MuseAI 是由阿里集团爱橙科技研发的面向阿里内部的 AIGC 创作工作台,同时通过与阿里云旗下魔搭社区合作共建的形式,将主体能力通过魔搭社区的 AIGC 专区对公众开放。本文主要介绍该设计平台的定位、目标和主要功能点,同时介绍了一些阿里内部应用的形式与案例。

大模型推理新突破:分布式推理技术探索与实践
大模型推理新突破:分布式推理技术探索与实践

在大模型的推理过程中,通常可以将任务分为两个阶段:Prefill 阶段处理所有输入的 Token,生成第一个输出 Token,并生成 KVCache。Decode 利用 KVCache 进行多轮迭代,每轮生成一个 Token。Pefill 阶段通常是计算密集型的,Decode 阶段通常是显存带宽瓶颈。本文中,我们阐述了 P-D 分离方案上线的实际效果。

阿里智能化研发起飞!RTP-LLM 实现 Cursor AI 1000 token/s 推理技术揭秘
阿里智能化研发起飞!RTP-LLM 实现 Cursor AI 1000 token/s 推理技术揭秘

相比于其他 AI 应用,LLM 的推理阶段最大的特点是它是一个自回归过程,绝大部分推理框架的优化工作都是围绕这个自回归过程展开的。

容联云唐兴才亮相QCon,揭秘金融行业智能体如何成为「生产力引擎」
容联云唐兴才亮相 QCon,揭秘金融行业智能体如何成为「生产力引擎」

在 2025 年 QCon 全球软件开发大会上,容联云大模型产品负责人唐兴才以《垂直行业大模型应用从“技术 Demo”到“生产力引擎”的跨越》为题,直面当前大模型技术落地卡点,结合银行、保险等实战案例,为行业带来一场关于“智能体价值变现”的硬核分享。

CVPR 2025 | 火山引擎获得NTIRE 视频质量评价挑战赛全球第一
CVPR 2025 | 火山引擎获得 NTIRE 视频质量评价挑战赛全球第一

Challenge-Track1-VQA 赛道以显著优势夺冠。基于能力强大的多模态大模型,团队方案成功构建了评估精度、计算效率俱优的画质评价模型,为大模型能力的利用提供了可行参考范式。

视频、游戏、AIGC全都要!多模态大模型如何玩转落地?| InfoQ《极客有约》
视频、游戏、AIGC 全都要!多模态大模型如何玩转落地?| InfoQ《极客有约》

全方位探讨多模态大模型的那些‘真相’!

GPT-4.1登场,实测碾压OpenAI所有模型,但效果不如Gemini?
GPT-4.1 登场,实测碾压 OpenAI 所有模型,但效果不如 Gemini?

GPT 4.1 现已接入 ChatLLM,在代码处理方面,它似乎不如 Gemini 2.5 Pro 和 Claude 3.7 Sonnet。

GitHub Copilot 加入基于 AI 的代码密码扫描功能
GitHub Copilot 加入基于 AI 的代码密码扫描功能

GitHub Copilot 加入 AI 代码密码扫描功能,提升安全检测能力。

六大趋势、140+专家深度输出,超千位开发者在QCon北京站看见AI落地的真实路径
六大趋势、140+ 专家深度输出,超千位开发者在 QCon 北京站看见 AI 落地的真实路径

在北京成功举办。位开发者、技术管理者和行业专家齐聚一堂,现场氛围热烈,交流深入。应用等热门方向。中国工程院院士,清华大学教授,博士生导师郑纬民院士围绕“人工智能大模型的几点思考”发表了主题演讲。

GPT-4.1 偷摸开测?神秘模型登顶编程榜,社区细扒指向 OpenAI,网友:营销鬼才又来了!
GPT-4.1 偷摸开测?神秘模型登顶编程榜,社区细扒指向 OpenAI,网友:营销鬼才又来了!

从概览页面来看,该模型正在迅速获得关注,目前已经在五大用例类别中挺进前十。

GitLab 17.9发布,支持自托管 AI 平台
GitLab 17.9 发布,支持自托管 AI 平台

GitLab 17.9 发布,支持自托管 AI 平台,提升开发效率与数据安全。

“Bug”还是“预演”?GitHub突然“封禁”所有中国IP,回应称只是技术问题......
“Bug”还是“预演”?GitHub 突然“封禁”所有中国 IP,回应称只是技术问题......

开源可以是无国界的,但逃离不了政治制约的 GitHub,无法真正做到无国界。

傅利叶发布首款开源人形机器人 Fourier N1,软件代码在内的完整本体资源包已公开!
傅利叶发布首款开源人形机器人 Fourier N1,软件代码在内的完整本体资源包已公开!

首批开源材料覆盖从硬件到基础控制系统的核心构建要素,帮助开发者在最短时间内完成 N1 的完整复刻,包括硬件制造体系、完整物料清单(BOM)、可直接加工的结构图纸、详细装配指南与操作演示视频、基础控制系统、基础操作软件代码(已开放 GitHub)、通讯接口封装。

深耕智能体验,MediaTek天玑开发套件与新芯片实现端侧技术突破
深耕智能体验,MediaTek 天玑开发套件与新芯片实现端侧技术突破

MediaTek 举办天玑开发者大会 MDDC 2025,联合产业伙伴加速智能体 AI 体验普及和发展

华为云发布CloudMatrix 384超节点,已规模上线昇腾云
华为云发布 CloudMatrix 384 超节点,已规模上线昇腾云

“华为并不发布面向 C 端的大模型应用,我们更关注的是怎么能让行业客户真正落地 AI。”

第一台AI算力本上市:原生Linux环境、本地训推320亿参数模型!七步搭出智能体,还支持跨应用调度APP
第一台 AI 算力本上市:原生 Linux 环境、本地训推 320 亿参数模型!七步搭出智能体,还支持跨应用调度 APP

各类 AI 应用工具层出不穷,并吸引了越来越多的大众群体。

百川智能2周年,王小川反思:战线拉得过长、不够聚焦,部分团队目标出现偏差
百川智能 2 周年,王小川反思:战线拉得过长、不够聚焦,部分团队目标出现偏差

“我们需要重申创业的初心,重整创业的组织,重塑创业的文化。”

Agent 时代的 HTTP 来了?谷歌A2A开源协议打破企业间Agent壁垒,OpenAI 系缺席标准之战
Agent 时代的 HTTP 来了?谷歌 A2A 开源协议打破企业间 Agent 壁垒,OpenAI 系缺席标准之战

开源协议获 50+ 巨头支持,破解跨平台智能体协作难题

Llama 4 先后被 DeepSeek、英伟达暴击,Meta 不再是大模型开源“霸主”了
Llama 4 先后被 DeepSeek、英伟达暴击,Meta 不再是大模型开源“霸主”了

很多真正重要的内容都被忽视了?

聊聊MCP:工具使用的平权时代?Function call时代结束?MCP化的难点?多Agent的问题解法?
聊聊 MCP:工具使用的平权时代?Function call 时代结束?MCP 化的难点?多 Agent 的问题解法?

又是 MCP!这个最近频繁被关注、被讨论的协议。

GPU 编程“改朝换代”:英伟达终为CUDA添加原生Python支持,百万用户变千万?
GPU 编程“改朝换代”:英伟达终为 CUDA 添加原生 Python 支持,百万用户变千万?

多年以来,英伟达为 GPU 开发的 CUDA 软件工具包始终缺少原生 Python 支持,现如今这种情况终于有所转变。

Devin 2.0 登场,AI 软件工程产品价格暴跌,从 500 美元直降至 20 美元!
Devin 2.0 登场,AI 软件工程产品价格暴跌,从 500 美元直降至 20 美元!

新版本现已正式上线,并引入一系列功能,旨在帮助开发者与 Devin 的自主智能体间实现更加顺畅、高效的协作。

18 岁亿万富豪遭名校集体拒收!高中靠 AI 狂揽 300 万用户,入学申请竟成“炫富”翻车现场?
18 岁亿万富豪遭名校集体拒收!高中靠 AI 狂揽 300 万用户,入学申请竟成“炫富”翻车现场?

一些人推测,其入学论文的内容可能为其录取结果带来了关键影响。

DeepSeek打击面太广!新论文疑是R2发布前兆,奥特曼火速“应战”:o3即将上线,GPT-5免费放送!
DeepSeek 打击面太广!新论文疑是 R2 发布前兆,奥特曼火速“应战”:o3 即将上线,GPT-5 免费放送!

有许多人称:这表示“R2 马上要来了”。还有网友这样肯定其成果:“从我在 o3 推理链中读到的内容来看,这很可能是 o3 方法论。”

小米SU7事故后,你还相信智驾吗?
小米 SU7 事故后,你还相信智驾吗?

近日,小米 SU7 的一场高速事故,不仅让作为厂商的小米汽车陷入了安全的舆情危机中,由于事故车辆期间使用了智能驾驶功能,同时正在引发公众对当前智能驾驶能力的更多疑问和争议。

从“人驱动”到“模型驱动”:聊聊 Agent 在 2025 年的爆发与挑战
从“人驱动”到“模型驱动”:聊聊 Agent 在 2025 年的爆发与挑战

随着 AI 技术的发展,Agent 技术正从“人驱动”向“模型驱动”转变。本文探讨了 Agent 在 2025 年的爆发与挑战,分析了模型推理能力、多模态模型的进步以及代码生成能力的提升。同时,讨论了通用 Agent 与本地 Agent 的不同模式及其技术选择,以及模型能力提升对 Agent 未来发展的影响。

    阿里云 AI 搜索 RAG 大模型优化实践
    阿里云 AI 搜索 RAG 大模型优化实践

    欧明栋 | 阿里云 高级算法专家

    立即下载
    基于 DDD 思想的酒店整体架构战略调整

    郑吉敏 | 去哪儿网 机票目的地事业群/技术总监

    立即下载
    通义灵码技术解析,打造 AI 原生开发新范式

    陈鑫(神秀) | 阿里云 云效、通义灵码产品技术负责人

    立即下载