10 月 31 日,由北京智源人工智能研究院主办的 2019 北京智源大会在国家会议中心开幕,会期两天。智源大会是北京创建全球人工智能学术和创新最优生态的标志性学术活动,定位于“内行的 AI 盛会”。
北京智源人工智能研究院将在人工智能数理基础、机器学习、智能信息检索与挖掘、自然语言理解、智能架构与芯片等重大研究方向支持科学家开展人工智能基础理论研究。其中,“智能信息检索与挖掘”是第三个确立的重大研究方向。中国人民大学信息学院院长文继荣教授将担任该研究方向的首席科学家。31 日上午,文继荣接受了 InfoQ 等少数媒体的采访,他介绍了智源团队在智能信息检索与挖掘方向上的目标构想并对未来信息检索的发展趋势作出了判断,他表示,搜索应该走向智能化。
打造一支“形散而神不散”的研究团队
" ‘智能信息检索与挖掘’ 实际上是智源人工智能研究院确立的第三个研究方向,主要聚焦于如何把最新的人工智能技术应用到信息检索和数据挖掘领域“。文继荣介绍,为实现该目标,智源汇集北京十几位最优秀的学者组成了一个强大团队。
据 InfoQ 了解,除文继荣外,中国人民大学窦志成教授将担任该方向研究项目经理,该团队还包括 6 位智源研究员,他们分别是,清华大学教授王建勇、北京大学教授崔斌、清华大学教授唐杰、中科院计算所研究员郭嘉丰、中国人民大学教授许君、清华大学教授刘奕群;以及 4 位智源青年科学家,分别是,中科院自动化所副研究员刘康、北京大学教授邹磊、中科院计算所研究员沈华伟、清华大学长聘副教授贾珈。
经过长期的沟通和交流,团队最终确定了智能信息检索与挖掘方向中长期的研究目标:构建面向未来下一代的个人智能信息助手。
文继荣表示,智源学者分布在多个科研机构、大学里,每个人有自己要研究的事情,自己也有团队,也有很多事情,本身形式上是相对比较分散的,虽然形式上比较分散,但我们希望大家聚焦于集体来做一件重要的事情。文继荣用“形散而神不散”作形容,他希望团队做到“神不散”,共同朝着构建“智能信息助手“的目标努力。
构建面向未来下一代的个人智能信息助手
基于“面向未来下一代的个人智能信息助手”的目标,十几个智源学者确定了四方面的研究内容:第一部分是智能信息检索的数学和认知理论基础,再往上是具体的技术和算法方面,这又分了三个方向来做。目前学者团队已各司其职,开始了自己的研究工作。
文继荣希望这个智能信息助手最终会像人一样智能,能做到“有问必答”、“对答入流”。这是一个非常重要且困难的课题,在短期内可能无法落地,这是一个长期的研究问题。
在往长远目标进发的路上,要有一些看得见、摸得着的一些中间成果。因此,文继荣团队定下了一个近期目标:在 1-3 年内做一个面向北京市民办事情政务信息获取的智能助手。它可以方便民众获取政务信息、简化办事流程。
“这个近期目标,是我们第一次对外说。这对我们来说是一个重要的决定”。文继荣的小目标是希望到 2022 年冬奥会时人手装上这样一个智能助手。在他看来,这个短期目标相较长期目标更加容易,也真正可落地。
文继荣告诉 InfoQ,对于政务信息助手在研发过程中可能存在的信息孤岛问题,届时团队将通过智源和政府沟通解决。
他表示,智能政务助手要朝着做“更自然”的对话努力,即便在人口语化的表述中存在关键词“缺位”问题,机器也能准确理解其意图。此外,这个助手还要做到更加个性化,随着人使用频次增加,它会变得比用户还懂他自己。有时候,人可能并不完全懂自己,如何在自己的助手里形成自己的人格、爱好,这都需要做大量的研究工作。
“我经常开玩笑,以后我们这些人去世了,我们把我们个人信息助手上传到空间,就永生了,它知道你”,文继荣表示,这件事情不是开玩笑,是完全可以去做的。这个过程中每个问题都是在人工智能这条路上非常关键的问题,他希望智源团队通过五年、十年甚至更久的研究努力,能帮人类往前推进一大步。
搜索应该走向智能化
对于 InfoQ 提出的智能信息检索和挖掘发展的发展趋势这一问题,文继荣表示,传统信息检索是一个有几十年历史的领域,本世纪初随着搜索引擎的发展,掀起了一股热潮,他也是从那时候起接触这个领域,当时,涌现了谷歌、百度等大公司。但大概从十年前开始,信息检索领域就没有特别多的重大突破了,好像已经没多少声音了,因为人工智能热潮起来了。
这个现象也引发了文继荣的思考。他认为传统的信息检索方法,包括架构,里面的核心算法等都到了应该有一些重大改进和突破的时候了。尤其是现在像深度学习、知识图谱这些新的技术在飞跃发展,这些技术是可以用到信息检索这样的领域来的。
“ 这也是我们提出信息检索和挖掘重大研究方向的原因,我们觉得搜索应该走向智能化”。
文继荣进一步谈到,现在的搜索常常是输入几个关键词一回车得到一堆网页,找到答案就走了。这些东西其实几十年都没变过,也有一些小的改进,比如查询时给查询推荐、让排序更准确,答案更直接等。不过这都是很细微的改进,还是脱不了原来的框架。
这个东西几十年没变,是不是到了该变的时候?
如果让大家选择,可能很多人会选择拥有一个“你问他,他什么都告诉你,你不问他,他也全都知道”的智能信息助手。随着技术发展,像这样的智能信息助手可以去做了,要是放到十年前,这件事太难了,很多人也尝试过,但当时技术没准备好,现在文继荣觉得,是时候了。
如果搜索走向智能信息助手,走向智能化,那么,各个方面都面临着很深刻的变化,比如查询的架构、交互方式就变了,原来是输入关键词回车得到一个网页的列表,这就是你的交互方式。其实这里面存在很多问题,如果这个过程中用户不满意该怎么办?其实真正的交互方式应该用对话来解决,用户的信息需求只有通过对话的方式才能够逐渐清楚。类似前述问题就是一个重大的变化,此外,各个方面整体都会变的。
评论