写点什么

北京大学教授,智源研究院院长黄铁军:实践人工智能路径的共同需求是算力丨智源大会

智源在创新研究、学术生态、成果转化、AI 治理上努力的一年

  • 2021-06-02
  • 本文字数:4925 字

    阅读完需:约 16 分钟

北京大学教授,智源研究院院长黄铁军:实践人工智能路径的共同需求是算力丨智源大会

2021 年 6 月 1 日,由北京智源人工智能研究院主办的2021 北京智源大会在中关村国家自主创新示范区会议中心开幕,会期三天。智源大会是北京创建全球人工智能学术和创新最优生态的标志性学术活动,本文为 InfoQ 记者带来的现场报道。


以下内容根据演讲速记进行整理,未经本人确认。


我代表智源研究院对过去一年的工作做一个报告。


智源研究院自成立以来,按照《北京市支持建设世界一流新型研发机构实施办法(试行)》文件精神,积极探索机制体制创新,已在创新研究、学术生态、成果转化、AI 治理等方面取得了重要进展。


首先简单回顾一下智源的愿景,分四个层次,聚焦原始创新和核心技术,建立自由探索与目标导向相结合的科研体制,支持科学家勇闯人工智能科技前沿“无人区”,营造全球最佳的学术和技术创新生态,推动北京率先成为国际领先的人工智能创新中心。


围绕这个愿景,智源在创新研究、学术生态、产业发展、AI 治理 4 个方面开展了工作。


首先报告创新研究。实现人工智能,公认有三大学派,或者说三大技术途径。


一是符号主义,源于计算机的发明和认知科学,基本思路是将智能形式化为规则、知识和算法,有过辉煌,但不能真正解决智能问题,最主要的原因是常识难以穷尽,人与人之间只能意会不能言传的东西,不能形式化为符号。


二是连接主义,即构造神经网络,因为生物智能的物质基础是神经系统,但并不知道什么样的网络能够产生预期功能?因此大量探索归于失败,深度学习这种成功,只是机器稀少的个案。


三是行为主义,认为智能来自智能主体与环境的互动,思想来源是进化论和控制论,成功案例是波士顿动力的机器人和大狗,困难在于构造什么样的主体,遇到的困难与连接主义类似。尽管困难,连接主义和行为主义的方向是正确的,并在本轮人工智能浪潮中发挥了基础作用。


本轮人工智能热潮,最主要的进展是深度学习和强化学习两套机器学习方法。深度学习主要源于连接主义,将符号主义时代人工从数据中抽取规则和知识的任务,大部分交由深度神经网络来完成。强化学习思想和行为主义一脉相承,采用深度神经网络作为智能主体,通过与虚拟环境的交互,实现自主智能。


当然,连接主义最直接的思路是模拟是逼近模拟生物神经系统,这有赖于脑科学特别是神经科学的进展,也将得益于数据和环境的数字化。因此,目前实现智能明确可行的路线有三条:深度学习+大数据+大算力、训练、信息模型;强化学习+环境模型+大算力训练自主智能;地球环境在太阳能的作用下进化出生物智能。


第一种技术途径是过去十年的主流,因为深度学习、数据和算力这三个要素都具备了,全世界掀起了“大炼模型”的热潮,催生了大批人工智能企业。但是,就像其他任何产业一样,热潮过后,就将进入集约化发展的新阶段,也就是“炼大模型”。


我认为,未来真正赋值各行各业的大模型,在全世界范围能都是屈指可数的,应该尽快把资源收敛到少数超大规模智能模型上来。正是因为认识到这一点,智源研究院发挥新型研发机构人才众多、机制灵活的优势,在 3 月 20 日率先完成并发布了我国首个超大规模智能模型“悟道 1.0”,训练出包含文源(中文)、文澜(多模态)、文汇(认知)、文溯(蛋白质)在内的系列大模型。


“悟道”大规模智能模型取得多项国际领先的 AI 技术突破和多个世界第一,同时也做出了多项行业贡献。建设并开放了全球最大的中文语料数据库 WuDaoCorpora2.0,提出了自然语言评测新标准“智源指数”,包含 6 种主要语言、30 余项主流任务与相关数据集,形成了大模型“权威考卷”。


生命模型,有赖于脑科学特别是神经科学的进步,首先要对大脑进行高精度解析,再在大算力的支持下进行高精度仿真模型。针对生命模型,智源研究院成立了生命模拟研究中心,负责开发高精度生命模拟仿真平台“天演”,构建和探索感觉、知觉、记忆等智能模型,争取成为新一代人工智能发展的不竭源泉。


生命模型本身就是脑科学研究的中心任务,是探索人类自身、解密智能成因的科学探索需要。“天演”生命模型系统已经开展斑马鱼全脑、灵长类视觉、人类心脏、人类认知等模型构建,推动生命科学、医疗健康和人工智能等前沿科研探索和应用发展。


第三条路线的挑战最大,核心是构建地球乃至宇宙的物理模型,培育新一代自主人工智能,应对各类自然挑战。智源已经启动了“天道”物理模型建设步伐,从基本粒子模拟开始,已建立了“分子模拟研究中心”,突破了分子模拟“快”与“准”难以兼顾的瓶颈,取得重要突破,将在未来五年内打造全球最具影响力的材料数据库,推动人工智能驱动的新一代分子动力学模拟迈上新台阶。


上述三条路径的核心任务分别是构建信息模型、物理模型和生命模型,共同需求是算力。


为建设超大规模智算平台,北京市专门安排了专项资金,建设体系架构先进、高速互联互通、可扩展高效并行的软硬件系统。在强大的智算体系支持下,三大模型性能快速提升,共同支撑新一代人工智能模型的建立,进而赋智各行各业,赋智万物。


智源研究院经过两年多探索,已经确定将打造智能模型作为源头创新的核心任务,在机构设置、资源保障和机制体制上进行了系统部署,全力构建信息模型、生命模型和物理模型“智能三剑客”。


简单小结一下,首先是“悟道”信息模型:数据是智能的素材,通过“大数据+大算力+强算法”,训练超大规模信息模型,为各行各业智能化提供切实可用的共性基础智能模型,是当前及未来一段时间人工智能全面赋智经济社会发展的中心任务;然后是“天演”生命模型:生命是智能的第一载体,模拟仿真亿万年进化而成的生物神经系统和身体,构建生命智能模型,挖掘生物智能机制机理,是发展新一代人工智能的不竭源泉;最后是“天道”物理模型:自然是生命的摇篮,地球是人类的摇篮,构建地球环境物理模型,是实现类人智能和人机共处共融的必要条件。建立宇宙物理模型,发展强人工智能,推动智能走出地球、穿越时空。本次智源大会,各位将亲眼目睹这三大模型的最新进展。


第二方面的工作是建设学术生态。智源从成立之初,就开始遴选智源学者,建设智源社区,积极打造全球人工智能学术和技术创新生态。“智源学者计划”主要支持顶尖科学家开展人工智能重大方向的基础前沿研究,支持青年科学家开展开放性、探索性研究。包含智源首席科学家、智源研究员、智源青年科学家等六个层次。已经围绕六大研究方向,遴选上百位智源学者,形成了 AI 科研的“北京力量”。


下面介绍一下六大重大研究方向的目标及工作进展。


“人工智能的数理基础”方向旨在建立以数学和统计理论为第一原理的新一代人工智能方法论,已取得了一系列成果:深度势能团队首次采用智能超算与物理模型结合,将原来可能需要 60 年才能完成的分子动力学模拟任务缩短到了 1 天,获得国际高性能计算应用领域最高奖——戈登贝尔奖;应用层面,团队提出的 MOML 算法已应用在冬奥赛场温度和风速预测,预测准确率大幅提高。


“人工智能认知神经基础”方向旨在将认知科学、神经科学和计算科学交叉融合,为人工智能的架构和功能探索新的模型和发展思路,目前正在建立全球规模最大的高精度生物智能开源开放平台及模拟系统。


“机器学习”方向旨在解决现有机器学习算法存在的可解释性缺失、大数据依赖、模型场景化等问题,开展“用户友好的 AI”研究,已经取得了阶段性进展。高效空间自适应推理,可实现高效的动态特征提取。朱军团队提出第三代安全可控人工智能,研发出全球首个针对算法模型本身进行安全检测的技术平台 RealSafe,提供从安全测评到防御加固的整体解决方案。


“智能体系架构与芯片”方向旨在从整机、编程、芯片、方法四个方面探索智能计算系统的发展,提出了“类脑计算完备性”及计算系统层次结构,相关工作发表于 Nature,探索出分形冯·诺依曼体系、支持 CNN+RNN 的混合神经网络处理器的新型架构。


“智能信息检索与挖掘”方向旨在建立智能信息检索与挖掘领域的“北京学派”,已经研发并上线了“交互式智能政务助手”,支持了 60 多个北京政务应用,针对信息检索的可解释性和公平性,提出双稳健排序等模型,连续两年在 ACM SIGIR 会议上贡献了约 10%的学术论文。


“自然语言处理”方向旨在提出“大数据+富知识+跨模态”共同驱动的新范式,在中文预训练模型、知识图谱、文本生成等领域,取得了一系列具有国际影响力的学术成果,研发出最大的中文预训练语言模型“悟道·文源”,研发的神经机器翻译工具包,成为国际三大神经机器开源软件之一。


智源研究院和国际 AI 技术生态深入融合,建设智源社区,今年将汇聚 10 万以上海内外人工智能科研人员。日常,智源社区举办丰富的学术交流活动,包括学术报告会、主题沙龙等,以及一年一界的智源大会,打造聚合全球一流 AI 学者前沿思想、连接世界 AI 学术与产业资源的平台,构建全球人工智能学术和技术创新生态。


“青源会”是智源研究院发起的青年科学家学术组织,为海内外的 AI 青年科学家和技术人员建立的宽松、活跃的学术交流平台,促进学科交叉,支持青年科学家提出具有引领作用的原创思想,开创新的科学前沿。在 6 月 2 日上午举办的“青源学术年会”上,将举办“青源会”成立仪式,详细介绍“青源会”发展目标及未来规划。届时欢迎各位参加。


当前,人工智能已成为经济发展的新引擎。智源研究院加快推进 AI 原创成果落地,加快人工智能深度应用,孵化 AI 创新企业,推动人工智能产业发展。


当前,健康医疗已成为人工智能最热门的研究和应用领域之一,北京在发展智能医疗方面,有着得天独厚的优势。为此,我们成立了“健康医疗研究中心”,构建医疗大数据和高质量小数据等基础数据,加快智能医疗核心技术突破,加快人工智能在健康医疗领域的深度应用。


此外,我们与清华智能产业研究院开展深度合作,推动以“个人”为核心的、AI 驱动的主动健康管理。在推动 AI 原创成果转化方面,去年建立了多个创新中心,加速 AI 原创成果熟化及工程化。智源为创新中心提供场地与研发资金支持,目前,已建设智能信息处理、认知知识图谱、安全人工智能等 8 个创新中心。


一年来,智源创新中心建设取得重大进展,例如:


  1. 视网膜芯片技术创新中心,研制出超高速脉冲视觉芯片,用于高速场景、弱小目标、全时检测等机器视觉应用。

  2. 安全人工智能创新中心,研发出 RealSafe 人工智能安全平台、DeepReal 深度伪造内容检测平台等,并在金融、能源等行业进行应用。

  3. 智能政务信息处理创新中心研发的政务问答系统,已在 60 多个北京政务场景中得到应用。

  4. 疾病脑电智能技术创新中心,研发的临床脑电图智能评估系统,准确率已达到落地应用水平,产品覆盖全国 11 个省市,累计服务超过上万名患者。


今年,我们按照国家和北京市促进科技成果转化的最新部署,积极整合技术、场景、人才、资金等资源,推出支持 AI 创业的“源创计划”,为 AI 创业团队开放大模型、数据集等生态资源,为来自学术界的 AI 科学家创业团队对接应用场景,为来自产业界的创业团队对接业界领先的 AI 技术,加快形成可落地应用的 AI 产品。另外,还将创业基金等方式,加快孵化一批具有国际领先技术能力的 AI 创新企业,为北京 AI 产业的持续发展储备力量。“源创计划”将在 6 月 3 日上午召开的“AI 创业论坛”正式发布,敬请期待。


当前,AI 伦理和治理成全球共识,国际社会正探索建立广泛认可的 AI 伦理原则,推进敏捷灵活的 AI 治理。智源研究院在 2019 年成立人工智能伦理与可持续发展研究中心,率先在国内开展 AI 伦理安全研究,并积极参与国际 AI 治理。


AI 伦理规范方面,2019 年 5 月,发布了我国首个 AI 发展与治理准则——《人工智能北京共识》。去年 9 月,又发布了我国首个《面向儿童的人工智能北京共识》。另外,我们建设了我国首个“人工智能治理公共服务平台”,针对人工智能技术研发及应用中存在的潜在伦理问题提供检测服务,帮助 AI 研发机构研发更符合 AI 伦理规范的技术和产品。联合国在 2015 年正式通过了可持续发展目标,共 17 大项,涉及社会、经济和环境三方面的发展问题。为此我们发起成立了“面向可持续发展的人工智能国际协作网络与智库”,目前已汇聚了来自 15 个国家的专家学者。


同时,我们也联合百度、小米、旷视、滴滴等企业发起了“面向可持续发展的公益计划”,目前已围绕城市治理、自动驾驶、劳动者就业影响、青少年心理影响等方面发布了首批 4 个研究题目,并已启动研究工作。后续,完成后的研究成果将会面向全球公开,服务于人类命运共同体的构建与实现。


以上是智源研究院一年来的工作进展,我的介绍就到这里,谢谢大家。

2021-06-02 14:423396

评论

发布
暂无评论
发现更多内容

Kubernetes中的CI/CD

倪朋飞

Kubernetes DevOps CI/CD

模块一:课后作业

菲尼克斯

架构实战营

Ansible 教程

码语者

DevOps ansible

#架构训练营作业一

吴猛

Python基础之:Python中的内部对象

程序那些事

Python Python3 程序那些事

每日总结-2021-04-05

cyningchen

MongoDB的几个常见问题

程序员架构进阶

mongodb 集群 28天写作 4月日更 实战问题

如何帮助一个新人快速融入团队

码猿外

团队协作 敏捷精益

文字变图片——GitHub 热点速览 v.21.14

HelloGitHub

GitHub 开源

starforce源码解读一:关键字partial

风翱

C# 源码阅读 4月日更 游戏框架

你朋友牛逼跟你有什么关系?

小天同学

自我思考 个人感悟 人生修炼 4月日更

让大家喘口气休息一下吧,工作中事情众多烦心时,让我们与工作独处一会儿。

叶小鍵

极速精简 Go 版 Logstash

万俊峰Kevin

Logstash go-zero Go 语言

VUE2,基于vue-cli搭建创建vue项目

Chalk

Vue 大前端 4月日更

设计模式-六大设计原则

U2647

设计模式 设计原则 4月日更

零基础学Tableau系列 | 05—(进阶)数据集合并、符号地图、智能显示、插入自定义形状、仪表板

不温卜火

数据可视化 数据清洗 4月日更

关于微信架构

俞嘉彬

模块1作业

段吉贵

架构实战营

学生管理系统方案架构设计

俞嘉彬

架构训练

return

Rust从0到1-所有权-切片类型

rust slices 切片

联邦查询引擎Presto源码编译与调试

小舰

源码剖析 presto 4月日更

说人话

ES_her0

4月日更

Vite 2 + React 实践

清秋

less vite antd React 4月日更

架构实战营模块1作业

白发青年

架构实战营

“学生管理系统”毕设架构设计

Vincent

架构实战营

支持向量机实现光学字符识别

不脱发的程序猿

人工智能 机器学习 4月日更 支持向量机 实现光学字符识别

硬核图解红黑树并手写实现

Silently9527

Java 数据结构与算法 红黑色

编程好习惯之理清函数参数

顿晓

编程好习惯 4月日更

千万不要轻易尝试“熊猫烧香”,这不,我后悔了!

冰河

互联网 网络安全 信息安全 渗透 蠕虫

《基于实践,设计一个百万级别的高可用&高可靠的IM消息系统》

后台技术汇

后端 消息系统 签约计划 引航计划 内容合集

北京大学教授,智源研究院院长黄铁军:实践人工智能路径的共同需求是算力丨智源大会_行业深度_InfoQ编辑部_InfoQ精选文章