写点什么

对话业界大咖:人工智能高速发展背后的原因到底是什么?

  • 2020-04-07
  • 本文字数:3497 字

    阅读完需:约 11 分钟

对话业界大咖:人工智能高速发展背后的原因到底是什么?

面向未来企业进行数字化转型,积极拥抱万物互联、万物智能的新时代已经成为众多企业的共识。


但是谈到目前最为火爆的人工智能技术在工业界的应用,依然有很多不一样的观点。那么人工智能技术在工业界应用的时机是否成熟,工业界在应用人工智能时又要遵循什么原则呢?


近日,小编有幸采访到美国罗切斯特大学(University of Rochester,USA)计算机科学系的罗杰波教授。接下来,让小编带大家一起来了解下人工智能高速发展背后的原因以及在工业界应用的建议吧~



美国罗切斯特大学(University of Rochester,USA)计算机科学系的罗杰波教授


罗杰波教授简介:


罗杰波教授是 IEEE、SPIE 和 IAPR 等国际著名学会会士(Fellow),研究涉及图像处理、计算机视觉、自然语言理解,机器学习、数据挖掘等多个前沿领域。罗教授曾在“柯达实验室”从事研究工作多年,并担任首席科学家。罗教授还是多个国际顶级会议的主席,并在多个国际顶尖学术期刊担任职务,发表超过 350 篇学术论文,持有超过 90 项美国专利。近年来,罗杰波教授在社交多媒体研究及其社会应用中做出了开创性贡献。


首先,您能结合自身的研究谈谈,为什么近些年 AI 领域能获得如此迅猛的发展吗? 是哪些关键要素促成了这样一个可喜的结果?


罗教授:


为什么 AI 这两年这么火,我认为有四个原因。


首先,是 Sensor Technology 的发展带动了图像采集的便利,使得图像处理的前期资源有了保证。


其次,是 Big Data 数据量上来了,可以用数据驱动模型来做这个事情。从前我们做这些事情是模型驱动的,不是数据驱动的。很多人都能认识到,我们有了很多数据,但是计算力不够也做不到。


第三,为 GPU、云计算领域技术的快速发展,促进了计算力的明显提升。在这样的时代背景下,人人都可以做这件事。我们早年开始做图像处理的时候内存就只有几兆,图像就只能一点点读,很多事情做不了,但是现在都可以做了。


第四,就是人力。有人说,人工智能是有多少人工就有多少智能,这个事情其实一点都不假。一方面,研究人员多了,比如人脸检测,很多人在做,数据集是开放的,大家都可以不停地刷数据。另一方面,就是标数据的人力数量的提升。比如,你有个想法要做一个手势识别,会有几十个人专门来标数据,一星期就标出很多数据,然后拿去训练,就可以很快实现。


我认为,是以上四个原因让人工智能飞速发展。上述原因主要是基于计算机视觉这个领域来分析,其实语音也是一样的,都是先标数据,然后经过大量的机器训练,最后到功能的实现。


您认为 AI 技术已经相对成熟,可以在工业界逐步走向商用了吗?


罗教授:


我先讲视觉领域,无论看国内还是美国,国内其实更明显,真正成熟的技术主要是围绕从检测到识别的人脸相关技术。为什么成熟呢?因为人脸技术虽然不是刚体,但是接近于刚体,变化比较小,不同的人种差异不大,即使带有表情也都可以识别。另一个我觉得比较成熟的 AI 技术是车辆识别,车辆虽然每年在更新,其实外观都差的不多。


因为有了斯坦福大学公开的图像识别数据集 ImageNet,才有了深度学习,其实一般物体的检测准确率已经大大提升。拿椅子举例,我们当年认为椅子是不可解的,是找不出来的。因为椅子不是一个视觉概念而是一个功能概念(人可以坐),椅子的形状材质各种各样,视觉上变数太大。现在为什么可以找出来呢,还是因为数据量大了,把所有椅子,从各种角度看的椅子都拿来训练,最终识别率就提升了。


工业界在应用 AI 时有几点要注意。关于 AI 技术从工业界到商用,我有一个 70-90-99.5 的经验公式。分为三个阶段:


第一个阶段的门槛是 70%。如果一个技术方向在实验室,在适量的数据集上能达到 70%准确,那么证明这个方向是可行的。


第二阶段是走出实验室到真实世界,用真实世界的数据把它推向更高的层次,目标是 90%。当准确性达到 90%大概率而且不出错时,可以去找一个垂直的场景,这个场景需要达到能够预估到剩下 10%的错误不是灾难性的,或者让它在有限的范围内准确性高于 90%,这样我们的产品就可以推广上市。


第三阶段的门槛我认为是 99.5%。我认为 100%可能性不大,但让机器做到 99.5%,就能达到超过人的程度,这个时候说明它已经走向产业化了。


其实到了 90%的时候就应该开始做,不要等到 99.5%再做。你在做的同时可以考虑和你应用有关的东西,同时学术界也会继续把它往前推,等你把这边工作做好了,学术界的研究也跟上来了。


您认为工业界在应用 AI 技术时,除了 AI 自身还需要关注哪些问题,或者需要避免哪些误区?


罗教授:


谈到误区有几个事情我想说明一下。我以前在柯达的时候,他们有一个做事的理念:事情没有做到完美就不能拿到市场上去。其实 AI 用这种理念来做是会受到影响的,我们到了 90%就可以推出去,这样我们就能在实践中找到缺陷在哪里。另外,是目前在中国看到的一个误区,事情还没有谱,就去大肆宣传,就去卖理念,最后造成大家很失望。因为之前 AI 好几次都是这样的,大家都认为 AI 要改变人类、改变生活,结果没有付诸行动实现,信心就撤掉了。要警惕这种过度承诺,要做到适度,既不要太激进也不要太保守,更不能被人忽悠。


还有一个注意要点跟安全、隐私有关,其中包括视觉和大数据用户画像,这个在一定程度上涉及了人的隐私边界。安全和隐私,企业还是要注意,哪些能用哪些不能用,要做到心中有数。用的时候,有一个方式就是把个体信息脱敏,聚合到群体信息中,这样没有针对某一个人,但是实际上是了解了一类人的行为,进而洞察出有价值的信息。


前些年,工业界大数据技术非常火爆,最近 AI 又在兴起,您怎么理解工业大数据和 AI 的关系?


罗教授:


这个事情我是比较有发言权,我发现有一些公司,他们经常把大数据和 AI 割裂开,或者成立两个部门管理,我认为这个做法是错误的。大数据如果不用 AI,大数据的价值是出不来的,因为数据多了以后,人是没有能力去分析这么多数据的,必须靠 AI。用 AI 去发现人不容易一眼就能看出来的东西,一个是数据量大,维度高的时候,人是没法想象的,这个东西只能靠 AI 来做,所以我认为大数据离不开 AI。反过来 AI 也离不开大数据,特别是现在数据驱动的一些模型,没有大数据寸步难行。


我不是说,AI 离开大数据什么都不能干。因为 AI 现在更多强调的也是如何运用数据来创造价值,AI 还是非常需要大数据的。我认为在学术界只想研究大数据或只想研究 AI 是可行的,但是在工业界两边都要看,不能隔绝开。而且只有当两个放在一起的时候,你才能实现价值的最大化。


最后请您判断一下,未来几年 AI 技术的主要发展方向和趋势。


罗教授:


我先讲一个我不是太熟悉的方向,我觉得硬件上肯定是会继续发展的。NVIDIA 现在其实也在推动一些把计算从云端往移动端或边缘端转移的事情,也有一些移动的芯片,我觉得端与云的协同会继续发展,这是一种趋势。


朱松纯的那篇《浅谈人工智能》内容很好,讲的就是大 AI。最早 AI 是一个领域方向,后来细分为视觉、语音、文本理解、机器学习、机器人等等若干领域。这是因为每个小领域的人认为,我们其实可以在这个领域里面率先取得突破。


现在大家在各自领域发展一段时间,已经取得了一些成绩,分享的意识就提高了,希望得到更多的关注与聆听。实际上,应该是 AI 所有的子领域在一起汇合,才会产生聚合效应。所谓“大 AI”,就是各个领域的成果互通,经验共享,这非常有意义。


拿机器人举例分析,实际上人和机器人最快捷的感知就是视觉,但是要给它命令需要语言,用语言去驱动它,而不是按个什么键。AI 有一个领域被大家遗忘了,Scheduling Planning(调度与规划)就是怎么去做一个计划。


Scheduling Planning 的典范就是导航 GPS,我要从 A 去 B 有这么多条路,我该怎么找出最佳的路线,这就是规划的问题,搜索在有一个目标函数的情况下找出最佳的结果。目前这个变成冷门了,但实际上,在机器人这个领域里面是绝对有用的。机器人要做一个事情,它在想我的任务是从这搬到那,我怎么去越过这些障碍,这就是 Schedule Planning 的问题,它得知道自己的位置,然后把这个环境映射到地图中。


机器人这个应用实际上会涉及到视觉、语音,然后你给他发号指令,并且不局限于简单的指令,NLP 也得有,它自己还得有 Schedule Planning ,而且好多东西都要机器去学习,所以在这个例子里, AI 最后起作用的是,AI 多分支整合产生的最大效应,这个我认为是接下来几年的发展方向。


实际上,特别是从工业界的角度,把这些最新的 AI 技术结合起来然后在一个场景下就可以爆发出最大的效应。客户不看你用的什么方法,无论是视觉还是语音,每一个领域都不是百分百对的,这个时候要采用多模态、多方式的思路,会让系统更加稳健。


本文转载自华为云产品与解决方案公众号。


原文链接:https://mp.weixin.qq.com/s/aZI5L28Z6mzenALerWKcLg


2020-04-07 17:191407

评论

发布
暂无评论
发现更多内容

“专业敏捷教练课程” 6月1-2日 · CSP-SM认证周末班【晋升高阶享多重福利】

ShineScrum

软件测试学习笔记丨Allure2报告中添加附件-日志

测试人

软件测试 测试开发

最新 Apifox 3 月更新:详解多分支升级、Query 参数支持枚举、自定义快捷键

Apifox

程序员 Apifox API 接口工具 API 工具

reduce函数20个高级用法 看看你掌握了多少?

高端章鱼哥

同城双活:交易链路的稳定性与可靠性探索

得物技术

Java 后端 中间件 双活

聊聊我做测试开发的十年心路历程

阿里技术

测试 开发

PostgreSQL数据迁移至Doris:一站式解决方案

NineData

postgresql Doris 实时数据分析 实时同步 NineData

是什么阻碍了你的成长

老张

个人成长 职场成长

一站式大数据开发与治理产品实践

Jackchang234987

元数据 大数据平台 数据开发平台 数据中台数据治理

如何轻松管理你的海外主机?实用技巧大公开!

一只扑棱蛾子

海外主机

自定义对象池实践

FunTester

保障校园网络安全用堡垒机的几个原因分析

行云管家

网络安全 数据安全 堡垒机 等保合规 校园

新版Redis不再“开源”,对使用者都有哪些影响?

华为云开发者联盟

数据库 redis 华为云 华为云开发者联盟 华为云GeminiDB

学算法要读《算法导论》吗?

京东科技开发者

大文件上传实践分享

京东科技开发者

CQ 社区版2.10.0 | 新增 SQL 审核、全新英文版上线…

BinTools图尔兹

mongodb mongo 数据库管理 SQL审核 SQLite编辑器

日立公司采用元太科技电子纸实现了无纸化营运

财见

OLAP性能再获突破!火山引擎ByteHouse性能白皮书发布

Geek_2d6073

基于vite多页面实现多端同构开发和部署

京东科技开发者

一文掌握Trello:功能解析、与其他工具优劣对比及高效使用技巧

爱吃小舅的鱼

任务管理工具 Trello

比 MyBatis 效率快 100 倍...

Java技术精选

DevOps迈向标准化,平台工程让开发运维更轻松

SEAL安全

DevOps 运维 平台工程

ChatTuGraph:通过大模型“与图对话”

TuGraphAnalytics

graph FineTuning Text2GQL

山东省正规等保测评机构名称以及地址一览表

行云管家

等保 山东 等级保护 等保测评

亚马逊云科技携手埃森哲、Anthropic助力企业打造负责任的AI

财见

TikTok直播专线是什么?有什么用?

Ogcloud

海外直播专线 海外直播 tiktok直播 tiktok直播专线 海外直播网络

百川仓配切量接口成长史

京东科技开发者

SpringBoot集成ElasticSearch,实现模糊查询,批量CRUD,排序,分页,高亮...

Java技术精选

阿里云实时计算Flink的产品化思考与实践【上】

Apache Flink

大数据 flink 实时计算

库存控制秘诀:鞋服品牌如何避免库存积压风险

第七在线

对话业界大咖:人工智能高速发展背后的原因到底是什么?_服务革新_华为云产品与解决方案_InfoQ精选文章