写点什么

英特尔高宇:AI 工作负载有多种形态和规模,硬件上没有一刀切的解决方案

  • 2023-12-11
    北京
  • 本文字数:1761 字

    阅读完需:约 6 分钟

大小:941.46K时长:05:21
英特尔高宇:AI工作负载有多种形态和规模,硬件上没有一刀切的解决方案

去年年底以来,随着 ChatGPT 应用体验界面的推出,使得以大模型为主的生成式 AI 技术取得了重大的并且快速地发展,大模型也展现出了令人惊叹的智能涌现能力,表现出了更为强大的创造性和通用场景的普通适用性,技术得以快速发展。


首先取得重大突破的是公共通用大模型,从人类社会大量存积下来的公共数据当中去学习,进而生成高质量的文本、图像、声音甚至是视频等内容,为各个领域的智能创新和每一个人的智能体验创新提供了巨大的想象空间。


然而,出于数据的安全和隐私保护的考虑,以及更高效率,更低成本来享用大模型通用能力的角度考虑,人们又既希望获得公共大模型目前的各类强大的通用服务,同时又希望 AI 能够真正理解自己,提供专属的个性化服务,还要能够充分地保障个人的数据和隐私安全,为此,公共大模型和面向个人的专有大模型混合部署,正逐渐成为产业的一个共识。


在这样的时代背景下,作为消费和商用个体用户中最坚挺的终端,PC 在 AIGC 时代承载了怎样的使命?


12 月 7 日,首届 AI PC 产业创新论坛在北京联想总部举行。此次论坛汇聚了众多用户、终端厂商、算力厂商(芯片)、AI 技术厂商(大模型)、应用领域生态合作伙伴,深度探讨 AI PC 为 AI 普惠带来的巨大改变。此外,在此次论坛上,业内首份《AI PC 产业(中国)白皮书》重磅发布。


与会嘉宾认为,AI PC 到来之际,大模型将成为每一个人必不可少的助手,同时对推理的算力需求将超过训练的算力需求。算力集中于云端的模式变得不可持续,AI 计算负载将逐渐由云端向边缘侧和端侧下沉。在搭建本地智能算力上,CPU+NPU+GPU 异构式架构方案是目前最为成熟的方案之一。


对此,英特尔中国区技术总经理高宇表示,AI 工作负载有多种形态和规模。所以,从硬件上没有一刀切的解决方案。“基于多年的学习与市场经验,我们提出了 XPU 的概念,包括 GPU/NPU/CPU。”他说,联想是英特尔的战略合作伙伴,双方已经基于即将发布的 Meteor Lake 处理器推进 AI 体验的开发和创新。


作为算力厂商的代表,英特尔正采取三项措施,来持续构筑端侧的算力。一是构建为 AI 而设计的高效能 AI-Ready 平台;二是提供工具以支持广泛的 x86 应用生态系统,三是激发创新,开启全新的 AI 体验,包括为软件和应用开发人员提供支持,以便在各个领域里都能更好将 AI 功能完美部署到 PC 客户端上。


英特尔今年还正式启动了首个“AI PC 加速计划”,将在 2025 年前为超过 1 亿台 PC 带来人工智能特性。其中,通过与超过 100 家 ISV 合作伙伴深度合作,并集合 300 余项 AI 加速功能,英特尔将在音频效果、内容创建、游戏、安全、直播、视频协作等方面继续强化 PC 的体验。


据了解,在实践中,英特尔 13 代酷睿处理器已经可以流畅运行 70 亿到 180 亿参数的大模型,并成功部署了 LLM。高宇表示,即将推出代号 Meteor Lake 的 AI PC 处理器,代表英特尔 40 年来最重大的架构转变,旨在为 AI PC 时代铺平道路。它是首个内置 AI 加速引擎 NPU 的处理器,可在 PC 上实现高能效的 AI 加速和本地推理。


为了完成用户相对复杂的任务,AI PC 往往需要调动不同的模型和应用,为 AI PC 的能力进行补充和延伸。因此,AI PC 功能的发挥不仅需要像英特尔这样的算力厂商的参与,还需要整个开放的行业生态作为支撑。


在 AI PC 的推动下,PC 产业生态将从应用为本转向以人为本,用户成为行业生态创新的驱动者和创造者。模型、应用、算力厂商都需要围绕 AI PC(终端)形态下新的以人为本的需求做出改变,在研发工作中对 AI 的高效运行予以充分的考量,以适应 AI PC 新时代。


联想作为终端厂商,是离用户最近的一端,因而被推到台前,成为生态组织者和生态的核心中枢。以场景需求为基础面向用户整合产业资源,承担 AI PC 技术整合创新交付者、新一代个人智能体及 AI 入口创造者和用户体验维护者、本地化个人数据及隐私安全守护者和开放的 AI 应用生态标准制定者和推广者身份,职责重大。正是出于行业责任,联想联合国际数据公司 IDC 发布业内首份《AI PC 产业(中国)白皮书》,对 AI PC 进行了全新定义,以加速构建 AI PC 产业新生态。


高宇最后表示,AI PC 加速计划由即将发布的 IntelCore Ultra 处理器率先驱动。未来,英特尔将搭建性能并行和吞吐量适用于融合 AI 的媒体/3D/渲染的 GPU,打造适用于持续的 AI 和分担 AI 负载的专用低功耗 AI 引擎 NPU;迭代能够快速响应,适用于轻量级、单次推理的低延迟任务的 CPU,相信在新平台的加持下,英特尔将加快与联想共同打造混合 AI 算力架构,驱动 AI PC 落地。

2023-12-11 19:514079

评论

发布
暂无评论
发现更多内容

NFTScan 与 Purelist 达成战略合作伙伴,双方在 NFT 一级发售方面展开合作

NFT Research

NFT\ 市场

借助Databuff,快捷构建Kubernetes可观测能力

乘云数字DataBuff

LLaVA:将视觉微调引入大模型

Zilliz

计算机视觉 LLM 大语言模型 模型微调

提升 API 可靠性的五种方法

高端章鱼哥

测试 API API网关

喜报!天翼云电脑获“光华杯”大赛一等奖、最佳创意创新奖!

天翼云开发者社区

云计算 云电脑

异步 I/O 探秘 —— 为什么说 Go 为我们提供了同步的网络编程接口 ?

蓬蒿

golang 异步IO asynchronous i/o netpoller

一步一图带你构建 Linux 页表体系 —— 详解虚拟内存如何与物理内存进行映射

bin的技术小屋

内存管理 Linux Kenel Linux内核 页表 Linux内核源码

【MySQL技术专题】「问题实战系列」深入探索和分析MySQL数据库的数据备份和恢复实战开发指南(系统底层优化篇)

洛神灬殇

MySQL 性能调优 技术分析 底层分析

九科信息中标招商局集团流程挖掘项目

九科Ninetech

定了!12支队伍进入HarmonyOS极客马拉松2023决赛

HarmonyOS开发者

HarmonyOS

陈毅威“掌舵”SUSE 中国 3.0,谋势数字江湖

Rancher

QCA9880+MT7915 mini pcie card chip difference

wifi6-yiyi

wifi5

一些可以极大提高工作效率的 Linux 命令

互联网工科生

Linux 自动化运维

阿里云瑶池 PolarDB 开源官网焕新升级

阿里云数据库开源

polarDB PolarDB-X PolarDB-PG 阿里云PolarDB

打翻夏日调色盘,华为与你多巴胺一“夏”

最新动态

永续期权合约交易所系统开发案例(成品)

薇電13242772558

交易所

飞桨AI for Science线下交流会:汇聚科学计算人才,携手共建繁荣社区

飞桨PaddlePaddle

人工智能 百度 paddle 飞桨 百度飞桨

如何设计一个低代码平台?安利这些技术组件

高端章鱼哥

低代码 低代码开发 表单设计 JNPF 代码生成器

Flink SQL 双表 JOIN 介绍与原理简析

腾讯云大数据

流计算 Oceanus

利用增强现实技术辅助跨国传输大文件的优化

镭速

唯一一家!国际测评:文心大模型3.5总分第一,算法模型第一,行业覆盖第一

飞桨PaddlePaddle

人工智能 百度 大模型 文心一言 文心大模型

减少跨国传输大文件所需时间的技巧与工具

镭速

跨国传输大文件

酒有十千,棋有独步——本土大模型百花齐放,文心一言站稳领先者身位RlueEva-System大模型测评来了!你pick哪一家

TE智库

语音标注平台是构建智能语音技术的重要基石

来自四九城儿

阿里云中“间“力量!RocketMQ

指剑

阿里云 RocketMQ 函数计算FC 事件总线Eventbridge

DTT直播回顾:一文带你全面了解openGemini

华为云开源

时序数据库 开源数据库 openGemini

算网深度融合成趋势,天翼云让政企上云更安全、更便捷!

天翼云开发者社区

云计算 云平台

MegEngine Python 层模块串讲(上)

MegEngineBot

Python 深度学习 开源 Data

上传了ipa但iTunes Connect没有构建版本问题

雪奈椰子

玩一玩编程式 AOP

江南一点雨

Java spring

英特尔高宇:AI工作负载有多种形态和规模,硬件上没有一刀切的解决方案_生成式 AI_李冬梅_InfoQ精选文章