写点什么

智源研究院理事长张宏江:大模型就是下一个 AI 的基础平台丨智源大会

  • 2021-06-02
  • 本文字数:1287 字

    阅读完需:约 4 分钟

智源研究院理事长张宏江:大模型就是下一个AI的基础平台丨智源大会

2021 年 6 月 1 日,由北京智源人工智能研究院主办的2021 北京智源大会在中关村国家自主创新示范区会议中心开幕,会期三天。智源大会是北京创建全球人工智能学术和创新最优生态的标志性学术活动,本文为 InfoQ 记者带来的现场报道。


以下内容根据演讲速记进行整理,未经本人确认。


下面由我来介绍智源对大规模智能模型发展的思考,以及在这方面的布局。


人工智能历经符号 AI、感知智能两代的发展,现在已进入由“数据-知识”双轮驱动的第三代人工智能。


第三代人工智能的核心思路是推进数据统计与知识推理融合,以及脑认知机理融合的计算,从认知的角度实现通用人工智能。


在这个方向上,“大模型+大算力”是迈向通用人工智能的一条可行路径。国际上,OpenAI 正是通过制造通用机器人和使用自然语言的聊天机器人,实现其通用人工智能发展战略。这个战略在去年有一个非常好的落地,就是去年 5 月发布的 GPT-3 模型,参数达 1700 亿;今年 1 月发布 DALL·E 模型具有强大的“文本-图像”生成能力。


从这个途径上来看,大模型对于人工智能具有重大意义,在于未来将基于大模型形成类似于电网的变革性产业基础设施。AI 大模型相当于过去一百年前开始普及的“发电厂”,它将把数据,也就是“燃料”,转换成智能的能力,转化成驱动各种 AI 的能力。如果将大模型和所有的 AI 应用相连接,将会为所有用户提供统一的智能能力,全社会形成一个智能能力生产和使用的网络,即“智网”。所以,大模型就是下一个 AI 的基础平台。


智源研究院作为 AI 基础建设的先行者,从去年 10 月份开始启动超大规模智能模型研发工作。今年 3 月 20 日,我们发布了中国首个超大规模智能模型“悟道 1.0”,取得了多项领域领先的突破。包括中文、多模态、认知、蛋白质预测在内的系列模型,取得了多项国际领先的 AI 技术突破,实现了我国在超大规模预训练技术上的并跑。


在研发“悟道”的过程中,很重要的一点是,改变了过去小团队的模式,我们用系统的方法做 AI 建立有目标的大团队,以问题为导,探索出最好的解决方案,这一块其实也是人工智能发展到今天的一个在模式上的转变。我们过去更多的强调是小范围的突破,今天人工智能走出实验室,从算法到技术,从小模型到大模型,这也是我们智源过去一年多的重点,就是如何把北京市,把全国 AI 研发的力量整合到一块,形成一个大兵团进剿的模式,把算力整合到一块,也是去年工作的重点。


在这里,悟道团队由智源研究院的学术副院长唐杰教授领衔,100 多位科研骨干共同参与的“悟道”团队,启动大规模智能模型研发工作,形成了人工智能的特战团队。经过一年多的努力,我们看到了一系列的成果,也就是今天发布的 2.0,就是阶段性的发布,相信我们未来还会有一系列的发布。今天我想重点要说的是 2.0 的一系列突破,真正推动了大模型作为 AI 的这样一个基础平台。


“悟道”2.0 智能模型系统将构建“大模型、大平台、大生态”:一是以“大规模”“高精度”“高效率”为发展目标,持续研发大模型;二是围绕大模型研发,构建大规模算力平台,支撑“信息”“生命”“物理”领域的大模型研发,我们希望通过大模型、大平台,能够和更多的工业运用者进行合作;三是通过示范应用搭建、API 开放、开源社区等,构建大模型生态。

2021-06-02 15:482237

评论

发布
暂无评论
发现更多内容

恒源云(Gpushare)_VSA:一个可变形尺寸窗口自注意力模型

恒源云

深度学习 GPU算力

已开源,就等你来!优酷动态模板研发体系为分发提效30%!

阿里巴巴文娱技术

开源 前端 开发工具 移动开发 开发框架

已开源!分发业务看过来【跨端动态模板引擎】

阿里巴巴文娱技术

ios android 开源 开发工具 移动开发

恒源云(Gpushare)_社区小伙伴的技术小闲谈

恒源云

深度学习 算法

企评家|上海星光电影股份有限公司成长性报告简述文章

企评家

大数据 企业 企业评价 企业大数据 企业成长性

国产ETL自动化运维调度工具 TASKCTL 控制容器概述

敏捷调度TASKCTL

大数据 DevOps 分布式 自动化运维 Kafka ETL

Apache APISIX Summit ASIA 2022——5月20日开启开源生态探索之旅

API7.ai 技术团队

网关 API网关 APISIX 开源生态 summit

阿里云EMAS旗下低代码平台Mobi开放定向内测

移动研发平台EMAS

阿里云 低代码 公有云 研发工具 全端

知乎疯传3W次,堪称最强Java面试题,顺利拿下京东T5的35K*16 薪 Offer...

Java架构追梦

程序员 java面试 offer 后端开发

云原生小课堂 | 一文入门性能凶悍的开源分析数据库ClickHouse

York

数据库 开源 容器 云原生 Clickhouse

腾讯云百万容器镜像安全治理运营实践

腾讯安全云鼎实验室

安全服务

堪称完美的SQL调优笔记居然是百万年薪阿里P8大佬熬肝纯手打,内容简直太香

Java架构追梦

Java 程序员 java面试 后端开发

【堡垒机】2022年网络安全堡垒机厂商排名看这里!

行云管家

网络安全 堡垒机 移动云 网络安全堡垒机

没想到我也可以入职阿里,两年CRUD,二本毕业,备战两个月面试阿里,侥幸拿下offer定

Java架构追梦

Java 程序员 后端开发

浅谈小程序开源业务架构建设之路

百度开发者中心

OneFlow学习笔记:从OpExprInterpreter到OpKernel

OneFlow

数据结构 学习笔记 虚拟机 代码 oneflow

netty系列之:可能有人听过ThreadLocal,但一定没人听过ThreadLocal对象池

程序那些事

Java Netty 程序那些事 4月月更

百度ToB垂类账号权限平台的设计与实践

百度开发者中心

三生万物,万企明道|明道云发布三周年

明道云

易观分析发布:证券类APP用户体验指数评测框架

易观分析

证券app

字节”再次起跳!内部651页剖析HotSpot 源码手册,GitHub开源

Java架构追梦

Java 程序员 后端开发 字节

热烈欢迎金蝶云·苍穹正式入驻 InfoQ 写作社区!

金蝶云·苍穹

区块链合约安全系列(一)公链合约权限校验引发的严重安全问题

BSN研习社

区块链

神秘男嘉宾登场,引爆全场灯光?

龙智—DevSecOps解决方案

Atlassian Confluence confluence插件

2022年国内外主流的10款Bug跟踪管理软件

爱吃小舅的鱼

基于SpringBoot2+redis+Vue商管系统,秒杀等,可二次开发接私活

Java架构追梦

Java spring 后端开发

华为云持续快速增长 践行“深耕数字化,一切皆服务”

科技热闻

KMRE 再升级!你们想要的功能它来了~

优麒麟

开源 软件 安卓 优麒麟 KMRE

张文骁:游戏开发的“零件人”梦碎之后|OneFlow U

OneFlow

关于一家企业的成长性评价,其评价维度都有哪些?

企评家

企业 分析 成长性 评价 企业成长性分析

2022年短视频电商品牌营销专题—手机品牌抖音营销分析报告

Geek_2d6073

智源研究院理事长张宏江:大模型就是下一个AI的基础平台丨智源大会_服务革新_InfoQ编辑部_InfoQ精选文章