旷视十年，回答AI技术价值跃迁的“灵魂”三问_AI&大模型_刘燕

【AICon】如何构建高效的 RAG 系统？RAG 技术在实际应用中遇到的挑战及应对策略？>>> 了解详情 



 写点什么

今年，AI 独角兽 — 旷视科技迎来了成立 10 周年。

7 月 16 日，在 2021·旷视技术开放日（MegTech 2021）上，旷视首席科学家、旷视研究院院长孙剑，旷视研究院张祥雨、范浩强、周而进等多位研究员，分享了旷视十年来在 AI 技术上的实践和思考，通过一系列技术演示，系统展示了旷视最新的技术成果。

基础科研是 AI 创新突破的基石

旷视首席科学家、旷视研究院院长孙剑总结了过去十年中国 AI 技术价值的发展历程。

AI 有没有用？AI 在哪里用？AI 易不易用？这是 AI 行业的“灵魂”三问，是所有 AI 企业需要回答的问题。

孙剑表示，人工智能最核心的动力是深度学习。在 2011 年 - 2012 年，深度学习刚刚崭露头角，展示出它比传统的方法有一定优势。在这个时期，一个主要回答的问题是，以机器学习为代表的 AI 到底是不是比传统方法好很多？到底能不能带来很大的价值？到底是不是有用？

因此从 2011 年开始，可以看到全球各个企业、高校都在投入大量的资金和人力研究 AI 在不同的应用上到底是不是有用。以旷视为例，旷视在 2012 年旷视推出了Face++开放平台，并在接下来的一两年里，使用深度学习第一次显著超越了传统的人脸检测和识别方法。

有了 AI 技术能解决很多问题，但 AI 应该用在哪里？孙剑表示，从 2014 年-2015 年开始，各行各业开始广泛应用 AI 技术。自 2015 年开始，旷视陆续推出了在线身份认证、智能摄像头、手机人脸解锁、物流操作系统河图、屏下指纹和摄影技术。

旷视首席科学家、旷视研究院院长孙剑

AI 发展的第三个阶段是现在时。现在 AI 的应用可以说是无处不在，但在有些行业应用较深，有些行业应用较浅。下一个阶段，AI 如何有更深入、更广泛的应用？它是不是好用，是不是易用的？门槛能否降低？

在第一阶段、第二阶段，把 AI 用得好，主要是靠经验丰富的算法工程师深入理解问题，一个问题一个问题地去攻克，并没有解决广泛行业应用者不懂深度学习的技术，或者对怎么用好没有掌握得很精深的问题。

孙剑认为，降低算法门槛，让非资深的算法工程师也可以使用 AI 工具解决各行各业的问题。这样才能回答 AI 好不好用、易不易用、是不是低成本的问题，让 AI 广泛得到应用，再向前推进。这也旷视推出其 AI 生产力平台 Brain++的初衷。

“AI 有没有用，归根到底是看 AI 基础科研有没有突破。基础科研是 AI 创新突破的基石，需要长期主义的坚持”，孙剑认为。

旷视研究院张祥雨研究员详细介绍了旷视在基础科研领域的布局。张祥雨介绍，旷视基础科研主要包括三类：基础模型、基础算法，基础应用。

旷视研究院张祥雨研究员

在基础科研创新方面，成立 10 年来，旷视在在学术上发表 85 篇顶级会议论文，在竞赛上获 40 项冠军，在实用上研发了包括ShuffleNets系列在内的众多基础模型，已经广泛应用在手机等智能设备上，推动软硬协同发展。

旷视现场展示了最新的基础科研成果，包括面向服务器和下一代 AI 芯片的通用模型 RepVGG 系列，其在开源后 Github star 已超过 1800；目前性能最强的端到端实时全卷积全景分割算法；以及挑战经典，目标检测架构创新的 YOLOF。

AI 在哪里用：从科研到落地

AI 在哪里用？

孙剑表示，要回答这个问题的关键词是“行业落地”，“推动算法边界拓展”，不断推动各种各样的算法在行业中得到深入运用。

旷视的技术主要有三大应用场景 —— 消费物联网、城市物联网和供应链物联网。AI 是核心能力，IoT 是落地场景，在数字世界与物理世界融合的智能化时代，AI 算法正在为产品带来更多的价值提升。从明星产品神行面板机系列，到超越人眼的暗光拍照和暗光视频，再到突破物理限制的屏下 AI 光学指纹和屏下摄像，以及追求全局最优解的河图系统和机器人设备。

旷视研究院范浩强研究员认为，业内存在的一些对于“人工智能和人工智障”的讨论说明，一些算法并没有达到用户对智能产品的预期。只有生产优质的算法，不断追求算法品质，才能够实现物理世界中真实的产品的价值。这些价值体现在更加鲁棒、适应多环境、更加符合用户预期等多方面。

旷视研究院范浩强研究员

旷视认为，算法不只让很多产品从好变更好，更能让产品从不可能变可能。

“传统意义上，很多做产品的人将算法定义成软件的一部分，在硬件设计好之后再思考软件该怎么构建，在这个过程中，算法可能只占最末端、最小的环节”，范浩强表示，“但在 AI 落地实践中，旷视发现，传统的产品算法思维是时候被颠覆了。现在，产品的易用度、特性很大程度上是由其算法所决定，需要在产品最早的定义、设计、研发全生命周期纳入对算法的考量。也就是说，算法不再仅仅是软件物料的一部分，它正在成为我们日常所使用产品中的核心组件”。

在旷视十年的 AI 实践落地中发现，从科研到落地，算法正在创造越来越大的价值，也在开始重新定义软硬件。

算法生产能力决定算法价值上限

算法生产能力决定算法价值上限，也决定 AI 是不是真的更易用。

传统的算法生产的过程很复杂，如果想在真实的生产环境中生产出有效的算法，往往要经过需求分析、数据处理、模型训练、上线部署等环节。此外，一次训练的算法并不能一次性解决实际场景中各种各样的问题，需要进行算法或模型改进环节。在经历多轮的常规算法生产过程中的迭代后，最终才能够得到一个实际落地应用过程中符合期望和体验的好模型或好算法。

而且，当前，大量算法生产过程还是非标准化的，因为非标准化，所以算法生产过程充满不确定性。 旷视研究院周而进研究员表示，算法生产的过程就像“炼金术”，需要付出大量时间试错。这个非标准化的生产过程，一方面需要靠全能型的人才从头到尾解决这个问题，这对于人才的储备、素质的要求非常高。另一方面如果算法流程仍然是这样一个高度耦合化的过程，这也说明整个算法生产在业界处于初级的阶段。

旷视研究院周而进研究员

旷视认为，落地实用是检验算法的最高标准之一，而生产落地实用算法的过程只有先标准化才能自动化，才能更进一步实现规模化的普惠易用。

从 2014 年至今，持续打磨升级的 AI 生产力平台Brain++：，就是旷视推动算法生产迈向自动化时代的 AI 基础设施。

周而进表示，旷视十年的的算法探索和应用落地，就是希望把整个算法生产的过程标准化。只有标准化了，才把之前积累下来的经验、模型、算法工程化起来，成为组件和工具。工程化之后，才有可能做到整个生产流程的自动化，从而大大扩大算法生产的能力。“我们希望 AI 生产力平台能够把整个算法生产过程，通过标准化和工程化的方式最终走向自动化的平台”。

在现场，旷视介绍了 Brain++的最新功能，包括自动化的数据管理和质检、自动推荐合适的训练算法和模型、自动检查算法准确率并给出优化建议等。此外，Brain++具有三大特点，一是生产真正有效算法；二是算法能力复用；三是公式化管理各类算法模型和策略，便捷用户调用和使用。

从基础科研，到行业落地，再到基础设施，这是人工智能技术价值跃迁的三个关键。预研一代、孵化一代、交付一代，是旷视技术创新的研发模式。在技术开放日现场，旷视将这一套创新研发模式首次对外完整的呈现出来。

旷视技术开放日的 Demo 展示现场

发布

暂无评论

促进软件开发及相关领域知识与创新的传播
关于我们
我要投稿
合作伙伴
加入我们
关注我们
联系我们
内容投稿：editors@geekbang.com
业务合作：hezuo@geekbang.com
反馈投诉：feedback@geekbang.com
加入我们：zhaopin@geekbang.com
联系电话：010-64738142
地址：北京市朝阳区望京北路9号2幢7层A701
InfoQ 近期会议
北京 · QCon全球软件开发大会 2024.4.18-20
北京 · AICon 全球人工智能与大模型应用峰会 2024.5.17-18
深圳 · ArchSummit全球架构师峰会 2024.6.14-15
上海 · FCon全球金融科技大会 2024.8.16-17
全球 InfoQ
InfoQ En
InfoQ Jp
InfoQ Fr
InfoQ Br

创作场景