专家观点认为,自然语言处理(NLP)正处于历史上最好的发展时期,技术在不断进步并与各个行业不断融合、落地。有数据统计,2020 年中国的 NLP 技术预计市场直接规模将达到 150 亿美元,企业智能直接市场规模超 200 亿元,二者可带动 4000 亿元间接市场规模,NLP 技术具有大规模的市场需求和可扩展的巨大市场空间。
今年以来,RPA 的热度居高不下,似乎大有成为新风口的势头,资本的嗅觉总是最敏锐的,也早早瞄向了这个领域。今年 6 月,顶级基金软银集团总裁兼董事长孙正义曾谈到,“世界经济将在 RPA 和 AI 的帮助下,迎来第二次经济大飞跃”。随着 RPA 技术流行,自然语言处理技术在办公下场景下焕发新生,有观点认为,未来,RPA 机器人或将取代 50%的基础性办公工作。
目前,自然语言处理技术的发展现状如何?如何更好地应用到产业中实现落地?未来 RPA 将有怎样的发展潜力?8 月 30 日上午,在 2019 年世界人工智能大会(WAIC)期间,在由达观数据、乐言科技联合主办的“理解语言,拥抱智能”主题论坛上,NLP 泰斗、国际计算语言学(ACL)终身成就奖得主、苏州大学特聘教授张民、达观数据 CEO 陈运文等多位 NLP 领域专家围绕 NLP 的学术与应用展开了讨论。
NLP 泰斗李生:人工智能未来将逼近人类智能,类脑研究是重点
自然语言处理领域的泰斗,已经 80 多岁高龄的李生教授是本次论坛备受期待的重磅嘉宾,演讲中他谈到了人工智能及 NLP 技术当下的现状、挑战,并展望了未来的发展趋势。
李生表示,人工智能的发展历经"三起两落",新一轮高潮的到来主要得益于深度学习算法,深度学习算法对今日的人工智能功不可没。
目前的人工智能正在从感知走向认知,各项技术发展迅速,深度学习、感知智能取得了重大突破,人脸识别已经广泛落地,识别与生成,进一步推动了计算机视觉的发展。
智能语音语言处理领域也成绩斐然,同声传译使用场景更加广泛,深度学习的自然语言处理已经走过了词、句子,代入编码、解码、模型阶段。2018 年 10 月,双向编码问世,中文的模型也不断引进。
但与此同时,挑战犹在。与人类相比较,人工智能与还存在着没有意识、不能思考、不能推理等一些根本性的差异;当前的人工智能所用的深度学习算法还有两大“软肋”:一是不具备小样学习功能,二是没有知识,更不必说用知识进行推理。此外,深度学习目前还存在着贪婪、脆弱、暗箱、肤浅等一系列的现象。因此,李生认为人工智能的研究任重道远。
人工智能的未来将向何处去?李生认为,人工智能应该会逐渐逼近人类智能,可能会有电脑思维的技术派和人脑思维的生物派两条途径 。
“我们要用脑科学牵头,带动计算机科学和数学等学科的深入研究。以类脑探索为重点,加速类脑芯片的研制。将软件算法与硬件芯片结合,数据统计与知识推理结合,进行新算法研究,包括基于人工神经网络的算法。计算电脑思维与认知人脑思维结合,搭建成能够融合这两种方法的融合框架 “。
近期国内外有一些类脑研究取得进展,今年 7 月,英特尔推出了可模拟 800 多万个神经元的 Pohoiki Beach 类脑芯片系统。一周前,浙大研发的新型类脑芯片“达尔文 2”在杭州发布。李生表示,这些成果都会加快人工智能由感知走向认知进程,让机器理解掌握运用好人类知识,实现推理机制,真正理解人类的意图,进一步做好人机融合。
NLP 处于历史上最好的发展时期
“对于创业公司而言,想要做人工智能,到最后却不知道人工智能到底是什么,最开始可以,但越往后,遇到的瓶颈越大 “。
那么,到底什么是智能?
苏州大学特聘教授张民认为,智能=知识+解决问题的能力。用语言的观点,把人工智能的内涵和外延做区分,内涵包括四方面,一个是脑认知基础,第二是知识工程,主张用知识+推理进行解决问题;能力有两种,一种是感知能力,一种是认知能力。外延包括两部分:机器人和智能系统。
“自然语言就是人工智能,如果你认为人工智能非常重要,自然语言就是人工智能领域最难、最重要的“。
自然语言处理(NLP)主要做三件事:分析/理解、生成、应用。分析/理解、生成是 NLP 的内涵,应用是其外延。
张民认为,目前,自然语言处理的的应用主要分为两类,一类是自然语言处理本身的应用,包括问答、对话、机器翻译、自动文摘、机器协作、阅读理解、信息抽取、情感分析、搜索、知识图谱、社交网络等。
二是自然语言处理技术深入运用到各个行业中。包括,教育、医疗、司法、金融、国防、公共安全、科技、广告、现代/传统文化、营销、客服、电商、游戏等各个领域。
“现在,自然语言处理处于历史上最好的发展时期,技术在不断进步并与各个行业不断融合,推动技术落地”,张民表示,AI 时代的自然语言处理具有六大特点:数据:语料库和知识库、新的表示方法、新的模型、新的架构、技术发展、产业应用。
不容忽视地是,自然语言在处理过程中还存在不少挑战,张民总结,挑战主要表现在六个方面:
1、低资源、小数据、跨领域、可解释、计算资源;
2、数据、知识表示和获取问题(常识、领域、语言学)知识推理和赋能;
3、符号、统计和连接主义方法在 NLP 的融合;
4、NLP 核心技术的突破;
5、行业赋能,行业融合,行业可定制、用户可定制;
6、多模态和工程问题。
演讲的最后,张民表示,自然语言处理学科本身要发展,一定要与产业界结合。此外,要正确看待“军备竞赛”,一方面它能不断激励技术创新以适应多变的时代;另一方面,它能让人意识到 NLP 学术发展未来的“天花板”和潜力在哪里。
RPA 或将代替 50%的基础性办公工作
“随着自然语言处理技术的发展,机器人处理重复性、机械性文字的能力很快就将超过人类。十年以后将有超过 50%的基础性办公工作,由文本流程自动化机器人完成 ”,达观数据 CEO 陈运文如是展望 NLP 技术在未来的发展潜力。
在演讲中,陈运文分享了自然语言处理技术目前在工业界的应用。“文字的自动化处理面临一个非常好的机遇。深度神经网络的技术从 2006 年由 Hinton 教授提出来以后,经过十多年的发展越来越来成熟,尤其是用在文本智能处理领域“。
陈运文介绍,通过将 NLP 技术与机器人流程自动化(RPA)结合,可以赋予机器人阅读思考的能力,在现有各类工作系统中协助完成阅读撰写等流程性的重复工作。他表示,RPA 技术与 AI 结合,可以带来智慧和办公自动化的进步,它能帮助企业将重复性劳动进行自动化处理,解放人的双手,代替人的工作。
与人类员工相比,达观智能 RPA 具有 7×24 小时全天候运作、高效、稳定、出错率低等优势,此外,它还更兼容、更开放,支持跨平台部署,适用 Linux、Windows、Mac、国产 OS 等操作系统。
据悉,目前达观数据已推出银行、财税、政务、保险、证券基金等数十种不同岗位的机器人员工。这些机器人员工已经在商业案例报告生成、智慧政务行政审批、金融文档验查和填写等场景中逐步开展各项工作。
可以预见,随着自然语言处理技术和行业经验的充分结合,未来会有越来越多办公场景将会被计算机代替。现在的比例不到 1%,十年之后能够到 50%,甚至更多。未来大型企业、政府机构等都会装备相应的智能 RPA 系统代替人工作。
“未来的办公形态,将会是半数人类员工,半数机器人员工,人做人擅长的事,机器人做机器人擅长的事。肯定有两个管理部门,一个管人的,一个管机器人的,呈现人与 AI 相互配合的状态 ”,陈运文预测。
评论 1 条评论