QCon北京「鸿蒙专场」火热来袭!即刻报名,与创新同行~ 了解详情
写点什么

英特尔高宇:AI 工作负载有多种形态和规模,硬件上没有一刀切的解决方案

  • 2023-12-11
    北京
  • 本文字数:1761 字

    阅读完需:约 6 分钟

大小:941.46K时长:05:21
英特尔高宇:AI工作负载有多种形态和规模,硬件上没有一刀切的解决方案

去年年底以来,随着 ChatGPT 应用体验界面的推出,使得以大模型为主的生成式 AI 技术取得了重大的并且快速地发展,大模型也展现出了令人惊叹的智能涌现能力,表现出了更为强大的创造性和通用场景的普通适用性,技术得以快速发展。


首先取得重大突破的是公共通用大模型,从人类社会大量存积下来的公共数据当中去学习,进而生成高质量的文本、图像、声音甚至是视频等内容,为各个领域的智能创新和每一个人的智能体验创新提供了巨大的想象空间。


然而,出于数据的安全和隐私保护的考虑,以及更高效率,更低成本来享用大模型通用能力的角度考虑,人们又既希望获得公共大模型目前的各类强大的通用服务,同时又希望 AI 能够真正理解自己,提供专属的个性化服务,还要能够充分地保障个人的数据和隐私安全,为此,公共大模型和面向个人的专有大模型混合部署,正逐渐成为产业的一个共识。


在这样的时代背景下,作为消费和商用个体用户中最坚挺的终端,PC 在 AIGC 时代承载了怎样的使命?


12 月 7 日,首届 AI PC 产业创新论坛在北京联想总部举行。此次论坛汇聚了众多用户、终端厂商、算力厂商(芯片)、AI 技术厂商(大模型)、应用领域生态合作伙伴,深度探讨 AI PC 为 AI 普惠带来的巨大改变。此外,在此次论坛上,业内首份《AI PC 产业(中国)白皮书》重磅发布。


与会嘉宾认为,AI PC 到来之际,大模型将成为每一个人必不可少的助手,同时对推理的算力需求将超过训练的算力需求。算力集中于云端的模式变得不可持续,AI 计算负载将逐渐由云端向边缘侧和端侧下沉。在搭建本地智能算力上,CPU+NPU+GPU 异构式架构方案是目前最为成熟的方案之一。


对此,英特尔中国区技术总经理高宇表示,AI 工作负载有多种形态和规模。所以,从硬件上没有一刀切的解决方案。“基于多年的学习与市场经验,我们提出了 XPU 的概念,包括 GPU/NPU/CPU。”他说,联想是英特尔的战略合作伙伴,双方已经基于即将发布的 Meteor Lake 处理器推进 AI 体验的开发和创新。


作为算力厂商的代表,英特尔正采取三项措施,来持续构筑端侧的算力。一是构建为 AI 而设计的高效能 AI-Ready 平台;二是提供工具以支持广泛的 x86 应用生态系统,三是激发创新,开启全新的 AI 体验,包括为软件和应用开发人员提供支持,以便在各个领域里都能更好将 AI 功能完美部署到 PC 客户端上。


英特尔今年还正式启动了首个“AI PC 加速计划”,将在 2025 年前为超过 1 亿台 PC 带来人工智能特性。其中,通过与超过 100 家 ISV 合作伙伴深度合作,并集合 300 余项 AI 加速功能,英特尔将在音频效果、内容创建、游戏、安全、直播、视频协作等方面继续强化 PC 的体验。


据了解,在实践中,英特尔 13 代酷睿处理器已经可以流畅运行 70 亿到 180 亿参数的大模型,并成功部署了 LLM。高宇表示,即将推出代号 Meteor Lake 的 AI PC 处理器,代表英特尔 40 年来最重大的架构转变,旨在为 AI PC 时代铺平道路。它是首个内置 AI 加速引擎 NPU 的处理器,可在 PC 上实现高能效的 AI 加速和本地推理。


为了完成用户相对复杂的任务,AI PC 往往需要调动不同的模型和应用,为 AI PC 的能力进行补充和延伸。因此,AI PC 功能的发挥不仅需要像英特尔这样的算力厂商的参与,还需要整个开放的行业生态作为支撑。


在 AI PC 的推动下,PC 产业生态将从应用为本转向以人为本,用户成为行业生态创新的驱动者和创造者。模型、应用、算力厂商都需要围绕 AI PC(终端)形态下新的以人为本的需求做出改变,在研发工作中对 AI 的高效运行予以充分的考量,以适应 AI PC 新时代。


联想作为终端厂商,是离用户最近的一端,因而被推到台前,成为生态组织者和生态的核心中枢。以场景需求为基础面向用户整合产业资源,承担 AI PC 技术整合创新交付者、新一代个人智能体及 AI 入口创造者和用户体验维护者、本地化个人数据及隐私安全守护者和开放的 AI 应用生态标准制定者和推广者身份,职责重大。正是出于行业责任,联想联合国际数据公司 IDC 发布业内首份《AI PC 产业(中国)白皮书》,对 AI PC 进行了全新定义,以加速构建 AI PC 产业新生态。


高宇最后表示,AI PC 加速计划由即将发布的 IntelCore Ultra 处理器率先驱动。未来,英特尔将搭建性能并行和吞吐量适用于融合 AI 的媒体/3D/渲染的 GPU,打造适用于持续的 AI 和分担 AI 负载的专用低功耗 AI 引擎 NPU;迭代能够快速响应,适用于轻量级、单次推理的低延迟任务的 CPU,相信在新平台的加持下,英特尔将加快与联想共同打造混合 AI 算力架构,驱动 AI PC 落地。

2023-12-11 19:514119

评论

发布
暂无评论
发现更多内容

Large Scale Distributed Deep Networks论文记录

春秋易简

小红书爆款笔记如何写,掌握3种类型的笔记写法

石头IT视角

filecoin矿机分币系统开发方案(现成)

跳槽时需要注意的事项

石云升

跳槽 职场经验 10月月更

Minio环境搭建

Fox爱分享

Minio 分布式文件存储

Java容器学习二

风翱

Java 10月月更

linux【redhat&ubuntu】下ffmpeg-3.1安装编译及视频转码

程序员架构进阶

架构 ffmpeg 视频流 10月月更

丰收音乐会,去找美丽却隐秘的生机

E科讯

现成filecoin算力挖矿软件系统开发公司

fil挖矿分币系统开发资料(案例)

IPFS云矿机分币软件系统开发简介(源码)

Go应用场景与适应项目

hanaper

IPFS算力挖矿系统开发方案(源码案例)

区块链将规则写入代码 重构市场新制度

CECBC

filecoin云算力挖矿系统软件开发源码搭建

Java 面试八股文之数据库篇(一)

Dobbykim

分布式文件存储系统Minio实战

Fox爱分享

Minio 分布式文件存储

IPFS分币挖矿系统软件开发资料(现成)

redis--多机

en

redis 高可用

未来已来,运营商如何驱动区块链应用创新提速?

CECBC

人工智能解决方案 --- 智能运维(AIOps)

micklongen

人工智能 AIOPS 知识图谱 智能运维 数据工程

现成IPFS分布式存储矿机软件系统开发案例

网络安全漏洞深度剖析

网络安全学海

网络安全 信息安全 渗透测试 WEB安全 安全漏洞

微信小程序获取用户授权的思路

Changing Lin

10月月更

手机影像二十载,AI多摄会是终极答案吗?

脑极体

央行数字货币即将破茧,一场大变局,震撼全球

CECBC

博鳌亚洲论坛国际科技与创新论坛第二届大会区块链分论坛紧密筹备中

时空云

区块链 博鳌 亚洲论坛

FIL云算力分币软件系统开发内容(源码)

越来越被需要的售前工程师·「这就是售前」前言

jiezhao

售前 企业服务

趣说 Node.js 的事件循环

Regan Yue

node.js Regan Yue 10月月更

站立会(Daily Scrum)我们说些什么

Bruce Talk

Scrum 敏捷 Agile Coach/Facilitate

英特尔高宇:AI工作负载有多种形态和规模,硬件上没有一刀切的解决方案_生成式 AI_李冬梅_InfoQ精选文章