写点什么

智源研究院理事长张宏江:大模型就是下一个 AI 的基础平台丨智源大会

  • 2021-06-02
  • 本文字数:1287 字

    阅读完需:约 4 分钟

智源研究院理事长张宏江:大模型就是下一个AI的基础平台丨智源大会

2021 年 6 月 1 日,由北京智源人工智能研究院主办的2021 北京智源大会在中关村国家自主创新示范区会议中心开幕,会期三天。智源大会是北京创建全球人工智能学术和创新最优生态的标志性学术活动,本文为 InfoQ 记者带来的现场报道。


以下内容根据演讲速记进行整理,未经本人确认。


下面由我来介绍智源对大规模智能模型发展的思考,以及在这方面的布局。


人工智能历经符号 AI、感知智能两代的发展,现在已进入由“数据-知识”双轮驱动的第三代人工智能。


第三代人工智能的核心思路是推进数据统计与知识推理融合,以及脑认知机理融合的计算,从认知的角度实现通用人工智能。


在这个方向上,“大模型+大算力”是迈向通用人工智能的一条可行路径。国际上,OpenAI 正是通过制造通用机器人和使用自然语言的聊天机器人,实现其通用人工智能发展战略。这个战略在去年有一个非常好的落地,就是去年 5 月发布的 GPT-3 模型,参数达 1700 亿;今年 1 月发布 DALL·E 模型具有强大的“文本-图像”生成能力。


从这个途径上来看,大模型对于人工智能具有重大意义,在于未来将基于大模型形成类似于电网的变革性产业基础设施。AI 大模型相当于过去一百年前开始普及的“发电厂”,它将把数据,也就是“燃料”,转换成智能的能力,转化成驱动各种 AI 的能力。如果将大模型和所有的 AI 应用相连接,将会为所有用户提供统一的智能能力,全社会形成一个智能能力生产和使用的网络,即“智网”。所以,大模型就是下一个 AI 的基础平台。


智源研究院作为 AI 基础建设的先行者,从去年 10 月份开始启动超大规模智能模型研发工作。今年 3 月 20 日,我们发布了中国首个超大规模智能模型“悟道 1.0”,取得了多项领域领先的突破。包括中文、多模态、认知、蛋白质预测在内的系列模型,取得了多项国际领先的 AI 技术突破,实现了我国在超大规模预训练技术上的并跑。


在研发“悟道”的过程中,很重要的一点是,改变了过去小团队的模式,我们用系统的方法做 AI 建立有目标的大团队,以问题为导,探索出最好的解决方案,这一块其实也是人工智能发展到今天的一个在模式上的转变。我们过去更多的强调是小范围的突破,今天人工智能走出实验室,从算法到技术,从小模型到大模型,这也是我们智源过去一年多的重点,就是如何把北京市,把全国 AI 研发的力量整合到一块,形成一个大兵团进剿的模式,把算力整合到一块,也是去年工作的重点。


在这里,悟道团队由智源研究院的学术副院长唐杰教授领衔,100 多位科研骨干共同参与的“悟道”团队,启动大规模智能模型研发工作,形成了人工智能的特战团队。经过一年多的努力,我们看到了一系列的成果,也就是今天发布的 2.0,就是阶段性的发布,相信我们未来还会有一系列的发布。今天我想重点要说的是 2.0 的一系列突破,真正推动了大模型作为 AI 的这样一个基础平台。


“悟道”2.0 智能模型系统将构建“大模型、大平台、大生态”:一是以“大规模”“高精度”“高效率”为发展目标,持续研发大模型;二是围绕大模型研发,构建大规模算力平台,支撑“信息”“生命”“物理”领域的大模型研发,我们希望通过大模型、大平台,能够和更多的工业运用者进行合作;三是通过示范应用搭建、API 开放、开源社区等,构建大模型生态。

2021-06-02 15:482211

评论

发布
暂无评论
发现更多内容

裁员名额谁来背?优秀985硕士无故被裁,劣币驱逐良币错在谁?

Java永远的神

程序员 面试 程序人生 后端 架构师

云图说丨什么是应用身份管理服务OneAccess

华为云开发者联盟

云计算 后端 华为云 12 月 PK 榜

FL Studio2024最新绿色版水果萝卜编曲软件

茶色酒

FL Studio FL Studio21 FL Studio2024

细说nodejs的path模块

coder2028

node.js

传统大型国企云原生转型,如何解决弹性、运维和团队协同等问题?

Serverless Devs

kubernetes 1.26发布,这十项新特性值得关注!

BoCloud博云

Kubernetes 云原生

圆桌实录 | 为什么不约而同选择了大 Kernel

MegEngineBot

深度学习 开源 MegEngine 大 Kernel

程序员最关心的问题,我都帮你们问AI了

大白给小白讲故事

AI写代码

可观测性之Micrometer Tracing

宋小生

全链路监控 可观测性 链路追踪 micrometer 全链路

CleanMyMac2024MACOS老牌清理软件

茶色酒

CleanMyMac CleanMyMac2024

PAI-Diffusion模型来了!阿里云机器学习团队带您徜徉中文艺术海洋

阿里云大数据AI技术

机器学习 算法 图文生成 12 月 PK 榜

软件测试 | Github 必会高频基础命令与 IDE 的 Git 集成

测试人

GitHub 软件测试 自动化测试 测试开发

Vue响应式依赖收集原理分析-vue高级必备

yyds2026

Vue

阿里云携手百奥利盟发布云上精准医疗与创新生物药数字化解决方案,助力行业数字化转型

云布道师

阿里云

Vue实战必会的几个技巧

yyds2026

Vue

Vue响应式系统原理并实现一个双向绑定

yyds2026

Vue

【敏捷研发系列】前端DevOps流水线实践

京东科技开发者

敏捷 前端 软件开发 运维‘ #DevOps

鸿蒙开发实例 | 为什么选择HarmonyOS?

TiAmo

华为 鸿蒙 华为云 12月月更

redux原理是什么

xiaofeng

React

react进阶用法完全指南

xiaofeng

React

Webpack配置实战

Geek_02d948

webpack

Webpack构建速度优化

Geek_02d948

webpack

Webpack最佳实践

Geek_02d948

webpack

OpenHarmony社区运营报告(2022年11月)

OpenHarmony开发者

OpenHarmony

ChatGPT完全火出圈了,你注册了吗?

Java全栈架构师

人工智能 程序员 AI 程序人生 ChatGPT

react组件深度解读

xiaofeng

React

说说Nodejs高并发的原理

coder2028

node.js

细说js变量、作用域和垃圾回收

hellocoder2029

JavaScript

JS知识点梳理之作用域、作用域链、柯里化、闭包

hellocoder2029

JavaScript

细说Js中的this

hellocoder2029

JavaScript

【秒杀购物商城业务服务】「分布式架构服务」盘点中间件服务的高可用模式及集群技术的方案分析

洛神灬殇

redis高可用 MySQL 高可用 集群 12 月 PK 榜

智源研究院理事长张宏江:大模型就是下一个AI的基础平台丨智源大会_服务革新_InfoQ编辑部_InfoQ精选文章