人工智能最近几年发展得如火如荼,学术界、工业界、投资界各方一起发力,硬件、算法与数据共同发展,不仅仅是大型互联网公司,包括大量创业公司以及传统行业的公司都开始涉足人工智能行业。尽管最近一年在资本市场趋冷的大环境下,AI 热度有所下降,但从长远来看,人工智能在各行各业获得越来越广泛的应用一定是社会发展最大的趋势之一。
从 AI 基础设施来说,人工智能专用芯片的研发方兴未艾,不仅包括英伟达 GPU、谷歌 TPU,国内的阿里、百度、华为等巨头公司,以及大量创业公司,都在 AI 芯片方面加快布局,随着 AI 应用进一步渗透到 IOT 等方向,相信对专用芯片的需求会越来越广泛。而作为各种 AI 应用开发工具的 AI 框架,也在之前的百花齐放式发展中逐步收敛,目前形成了 PyTorch 引领学术界,TensorFlow 主导工业界的双雄局面;而随着中台概念的日益兴起,国内大型互联网公司也正在以 AI 中台的面貌推出各自的高层开发框架,大量 AI 创业公司则逐步转向金融、安防等垂直行业深耕细作的模式。
从 AI 技术进展的角度来看,有几个明显的技术趋势已日益凸显。首先,随着以智能手机为代表的移动终端计算存储能力快速加强,端 AI 与边缘计算技术正在快速发展与普及,如何在应用效果尽可能高的前提下,将模型做小做精致做快,是这个发展方向的关键点。
其次,传统机器学习严重依赖训练数据的规模与质量,这制约了领域技术的快速发展,而最近的明显趋势是由最常见的监督学习向半监督、自监督甚至无监督机器学习转向,如何用尽量少的有标训练数据让机器自主学会更多的知识,是大有前景的发展方向。
第三,AutoML 正在快速地渗透到各个 AI 应用领域,从最早的图像领域,目前已经拓展到 NLP、推荐搜索、GAN 等多个领域,随着 AutoML 技术的逐渐成熟,搜索网络结构成本越来越低,相信会有更多的领域模型会由机器来设计,而不是目前的算法专家主导的局面,这个技术趋势基本是确定无疑的。
再者,随着 5G 等传输技术的快速发展,视频、图片类应用快速成为最主流的 APP 消费场景,而机器学习技术如何更好地融合文本、图片、视频、用户行为等各种不同模态的信息,来达到更好的应用效果,相信也会越来越重要。另外,如何让机器能够生成高质量的图片、视频、文本等生成领域,最近两年也出现了大量有效新技术比如图像领域的 GAN 以及文本领域的 GPT2 等模型,而这种具备创造性的生成领域,虽然之前由于受到技术发展水平限制,大家投入的精力不多,随着相关技术日益成熟,这块相信也会越来越重要。
从 AI 应用领域发展趋势来讲,最主要的几个 AI 方向比如自然语言处理、图像视频处理及搜索推荐方向,最近一年来技术发展各自精彩纷呈,又呈现出不同的发展格局。
自然语言领域在最近两年发生了天翻地覆的技术变革,进入了技术井喷的快速发展期,而这一巨变的引发者是由 Bert 为代表的预训练模型及新型特征抽取器 Transformer 的快速发展与普及带来的。从 Bert 的应用来看,已经在包含对话系统、机器阅读理解、搜索、文本分类….等几乎大多数 NLP 应用领域快速应用,并在部分应用领域取得了突破性的效果提升;作为刚提出一年多的新型研究范式,我们目前对 Transformer 和 Bert 为何有效的理解还比较浅显,同时 Bert 模型还有很多值得深入改进的方向,比如生成模型、训练方法优化、长文档处理、多模态融合……等,都需要进一步更深入的研究。最近一年也陆续出现了大量效果突出的改进模型,比如 XLNet、RoBERTa、ALBert、Google T5 等一系列改进。相信随着大家对 Bert 的理解逐渐深入,对 Bert 模型的快速改进以及更多领域更好的应用效果会成为 NLP 领域的常态,我们在不远的未来会看到 NLP 领域更多新模型的出现,以及这些新技术推动实际应用场景的快速进步。
图像处理领域是 AI 的另一应用主战场,但是,除了近年来深度学习、ResNet 两大图像处理领域的巨大技术革新外,最近两年来,CV 领域并未有特别巨大的技术革新与进步,目前进入技术平稳发展期。归功于基础技术的快速进步,很多 CV 应用已相对成熟,所以近年来我们体会更多的是各种前沿技术在各个行业的应用落地与实践。
对于推荐与搜索等具备较长工业化发展历史的 AI 应用领域,深度学习在最近两年已经在各种互联网公司比较广泛地获得了尝试和应用。尽管并未像 NLP 与图像领域那样,深度学习相对传统模型获得突飞猛进的技术突破,而且对于比如推荐领域 DNN 模型的效果到底如何在学术上还存在争议,但是相信这些领域如果能够正确借鉴其它 AI 领域的技术进展,会在未来两年内出现令人惊喜的效果突出的技术进化。
综合而言,AI 技术发展整体进入快车道,不同领域又各有特色、发展阶段以及各自的精彩。可以坚信的一点是:相信 AI 会日益渗透到我们生活的方方面面,帮助我们生活得更轻松更美好!
作者介绍
张俊林,中国中文信息学会理事,中科院软件所博士。目前担任新浪微博机器学习团队 AI Lab 负责人。在此之前,张俊林曾经在阿里巴巴任资深技术专家并负责新技术团队,以及在百度和用友担任技术经理及技术总监等职务。他是技术书籍《这就是搜索引擎:核心技术详解》(该书荣获全国第十二届优秀图书奖)、《大数据日知录:架构与算法》的作者。他本科毕业于天津大学管理学院,之后在中科院软件所直接攻读博士学位,研究方向是信息检索理论与自然语言处理,就学期间曾在 ACL2006、COLING2004、IJCNLP2004 等国际顶级会议发表多篇学术论文。另外,他在此期间领导设计的搜索系统曾在美国国防部 DARPA 主持的 TREC 高精度检索系统评测中取得综合排名第一名的优异成绩。近年来,陆续在 Recsys2019 以及 ICDM2019 等国际会议发表多篇深度学习推荐系统相关论文。
福利时刻:
张俊林老师将在 11 月 21-22 日的AICon大会上担任“搜索推荐与算法”专场的出品人,想要跟张老师深入交流的,不要错过面基的机会。另外,大会还有关于机器学习、NLP、语音交互、智能金融等 50+最新落地案例,更有来自 AWS、微软、BAT、华为等国内外一线 AI 技术专家带来干货演讲,部分议题抢先看:
【蚂蚁金服】金融知识图谱在蚂蚁的业务探索与平台实践
【菜鸟网络】人工智能在智慧交通物流的技术演进之路
【阿里妈妈】工业级深度学习在阿里广告的实践、创新与最新进展
【微软小冰】人格化对话机器人的构建及在语音场景当中的实践
【百度】AI 大生产时代下的 NLP 技术创新与应用实践
目前大会9折售票倒计时3天,购票页面输入优惠码“aicon”还可享折扣价,抢票咨询:18514549229(同微信)
评论