2021 年 6 月 1 日,由北京智源人工智能研究院主办的2021 北京智源大会在中关村国家自主创新示范区会议中心开幕,会期三天。智源大会是北京创建全球人工智能学术和创新最优生态的标志性学术活动,本文为 InfoQ 记者带来的现场报道。
以下内容根据演讲速记进行整理,未经本人确认。
下面由我来介绍智源对大规模智能模型发展的思考,以及在这方面的布局。
人工智能历经符号 AI、感知智能两代的发展,现在已进入由“数据-知识”双轮驱动的第三代人工智能。
第三代人工智能的核心思路是推进数据统计与知识推理融合,以及脑认知机理融合的计算,从认知的角度实现通用人工智能。
在这个方向上,“大模型+大算力”是迈向通用人工智能的一条可行路径。国际上,OpenAI 正是通过制造通用机器人和使用自然语言的聊天机器人,实现其通用人工智能发展战略。这个战略在去年有一个非常好的落地,就是去年 5 月发布的 GPT-3 模型,参数达 1700 亿;今年 1 月发布 DALL·E 模型具有强大的“文本-图像”生成能力。
从这个途径上来看,大模型对于人工智能具有重大意义,在于未来将基于大模型形成类似于电网的变革性产业基础设施。AI 大模型相当于过去一百年前开始普及的“发电厂”,它将把数据,也就是“燃料”,转换成智能的能力,转化成驱动各种 AI 的能力。如果将大模型和所有的 AI 应用相连接,将会为所有用户提供统一的智能能力,全社会形成一个智能能力生产和使用的网络,即“智网”。所以,大模型就是下一个 AI 的基础平台。
智源研究院作为 AI 基础建设的先行者,从去年 10 月份开始启动超大规模智能模型研发工作。今年 3 月 20 日,我们发布了中国首个超大规模智能模型“悟道 1.0”,取得了多项领域领先的突破。包括中文、多模态、认知、蛋白质预测在内的系列模型,取得了多项国际领先的 AI 技术突破,实现了我国在超大规模预训练技术上的并跑。
在研发“悟道”的过程中,很重要的一点是,改变了过去小团队的模式,我们用系统的方法做 AI 建立有目标的大团队,以问题为导,探索出最好的解决方案,这一块其实也是人工智能发展到今天的一个在模式上的转变。我们过去更多的强调是小范围的突破,今天人工智能走出实验室,从算法到技术,从小模型到大模型,这也是我们智源过去一年多的重点,就是如何把北京市,把全国 AI 研发的力量整合到一块,形成一个大兵团进剿的模式,把算力整合到一块,也是去年工作的重点。
在这里,悟道团队由智源研究院的学术副院长唐杰教授领衔,100 多位科研骨干共同参与的“悟道”团队,启动大规模智能模型研发工作,形成了人工智能的特战团队。经过一年多的努力,我们看到了一系列的成果,也就是今天发布的 2.0,就是阶段性的发布,相信我们未来还会有一系列的发布。今天我想重点要说的是 2.0 的一系列突破,真正推动了大模型作为 AI 的这样一个基础平台。
“悟道”2.0 智能模型系统将构建“大模型、大平台、大生态”:一是以“大规模”“高精度”“高效率”为发展目标,持续研发大模型;二是围绕大模型研发,构建大规模算力平台,支撑“信息”“生命”“物理”领域的大模型研发,我们希望通过大模型、大平台,能够和更多的工业运用者进行合作;三是通过示范应用搭建、API 开放、开源社区等,构建大模型生态。
评论