9月6日-7日,由上海宝山区人民政府指导,AICUG人工智能技术社区、临港海创、临港新业坊共同主办的2019 AI先行者大会(AI Pioneer Conference)在上海召开,来自阿里巴巴、英特尔、旷视、腾讯、驭势科技、百度、云测数据、英伟达等企业的资深技术专家分享了在NLP、语音技术、推荐算法等AI前沿技术方向上的最新研究进展和新洞见。
本文精选其中部分专家演讲的精华内容进行总结回顾。
阿里达摩院:语言智能赋能电子商务
阿里巴巴达摩院高级研究员、语言技术实验室首席科学家司罗教授分享了自然语言处理技术在电子商务场景中的运用。
自然语言智能是研究人与计算机之间如何用语言进行有效通讯的学科,它包括自然语言形式化的抽取、分析、转化、生成等多方面的课题。人工智能分为计算智能、感知智能、认知智能、创造智能等层面,司罗认为,自然语言处理是实现上述智能的重要研究方向,自然语言处理技术是实现完整或强人工智能的必要技术。
自然语言处理的应用场景非常广阔,在阿里的电商场景下,自然语言处理技术得到了很好的运用。譬如服务于整个阿里巴巴生态系统的大规模自然语言技术平台——AliNLP,它利用数据收集处理,文本分布式表示,多语言词汇、句法分析等技术,该平台每天可用于 600 多种业务场景,超过 20000 亿次 API 调用。该平台的核心特征之一是利用用户行为数据代替了传统标注数据来训练 NLP 算法,这很好的适应了阿里复杂且多变的电商场景。
司罗还介绍了阿里的机器翻译平台,该平台包括大规模无监督抓取平台、神经网络机器翻译引擎、人机互助众包翻译标注平台。他表示,阿里拥有令机器翻译直接产生商业价值的最大场景,机器翻译技术是阿里国际化业务的技术生命线。其中一个典型的运用案例是,利用实时沟通翻译技术来帮助跨境交易中的买家和卖家进行实时对话,在这个过程中,达摩院团队基于电商场景作了优化并增加了实时纠错等更加先进的特性。
司罗表示,阿里的自然语言技术团队目前在探索超越电商场景以外的运用场景,如医疗信息管理、智能通讯、企业合同、地址信息管理等方面。
腾讯:拥抱云与开源
在题为《拥抱云与开源,开启数据智能新时代》的演讲中,腾讯开源联盟主席、专家研究员、腾讯大数据海量存储与海量计算负责人堵俊平分析了目前云计算、大数据、与人工智能的发展趋势,开源与技术生态。
堵俊平表示,云计算、大数据与人工智能的飞轮效应是数字世界的基石,是消费互联网和产业互联网的共同引擎,到 2021 年,云将承载 80%应用的开发和部署。
2018 年 9 月,腾讯进行了史上第三次组织架构调整,宣布向产业互联网转型,在产业互联网战略中,AI、云计算、大数据都承担着十分重要的角色。堵俊平介绍,目前腾讯通过 20 年技术积累,已经建立起了云大数据和人工智能产品矩阵,包括 AI 引擎能力、AI 基础能力、大数据基础能力等基础服务产品;腾讯人工智能服务平台、智能对话平台等应用服务产品等应用服务产品;并为零售、金融等行业提供解决方案。他还表示,目前人工智能落地产业互联网方面还面临很多挑战,具体表现在应用多样性、基础设施灵活性、数据发展质量和规模、算法与模型调优、智能设备多样性等方面。
谈到目前开源与技术生态时,堵俊平表示,开源的本质是开放式协同创新,能够创造无法估量的价值,开源成功的要素是技术、社区、应用生态与创新。他认为,云与开源的结合能够做到用开放的生态打造事实标准,帮助新技术快速规模化落地。
英特尔:边缘智能新时代下的视觉解决方案
在 9 月 7 日上午的“AI 解决方案”分会场中,英特尔中国物联网事业部策略市场经理宋洪涛在演讲中全面分析了边缘智能的市场机会和发展趋势,并分享了英特尔在该领域的最新进展和解决方案。
有数据统计,到 2023 年,整个计算机视觉市场规模将突破 173.8 亿美元,到 2022 年,视频分析市场将突破 111.7 亿美元,年复合增长率为 21.5%,2016 年,深度学习收入为 6.55 亿美元,到 2025 年预计增长至 350 亿美元,年复合增长率为 53%。宋洪涛认为,视频应用的爆发将推动边缘智能的发展,2019 年每天生成 2500PB 的视频监控数据,带宽和存储成本、近实时响应需求、预测取证等因素将推动实现边缘计算机视觉和深度学习。
演讲中,宋洪涛详细介绍了英特尔的边缘推理开发工具 OpenVINO 工具套件,它包括深度学习部署工具包、通用深度学习推理工具包、及针对 OpenCV 和 OpenVx 优化的传统计算机视觉库。OpenVINO 支持各种英特尔平台的硬件加速器上进行深度学习,并轻松部署到不同类型的英特尔平台上,且允许直接异构执行。OpenVINO 可从边缘到云、加速开发具备高性能计算视觉和深度学习推理功能的视觉 AI 应用,该套件可运用到医疗、零售、办公自动化、安防监控等领域。
百度:好看视频推荐系统的实践与思考
好看视频是百度推出的一款短视频应用,推荐系统在其中内容的分发上起到了非常关键的作用。百度资深研发工程师钱建平在演讲中分享了好看视频背后的推荐算法技术。
创作者创作的视频在触达用户之前,先要经过推荐系统。在 C 端,好看推荐系统主要解决三个方面的问题,针对用户,要分析其兴趣爱好、在好看上的行为、站外的行为等;针对环境,要分析地域、日期、网络环境等;针对内容,要分析其视频分类、标签等固有属性,点击率、互动率等后验信号;作者信息等。在 B 端,好看推荐系统主要解决作者和内容两方面的问题,如何将作者留住以及如何让好的内容得到更多分发。
接下来,钱建平全面介绍了好看推荐系统的全貌,其推荐流程呈现一个“漏斗”形状,从上到下依次为“正排”—“召回” —“粗排”—“精排”—“机制”—“多样性”——“干预”。其中,“召回”很重要,它是最大的“漏斗”,召回目的主要目的是提高效率,召回需要满足相关性、时效性、多样性和探索、生态相关等需求,召回的模型主要有 CB 类和模型类召回两类,其中,模型类召回中用到最多的是 item CF 类(召回)。
钱建平认为排序是推荐系统的指挥棒,其有助于帮助推荐系统实现“长期留存”的目标。当计算能力有限的情况下,可以用分层排序方法来实现高效排序。排序最重要的工作是互动,互动可以提高用户长期留存,用到的一个关键模型是 Multi —Task Learning ,它具有缓解稀疏问题、节约存储等机器资源的优点。
在好看视频的内容理解层面,主要有内容分类、泛标签、知识结构话等理解维度,主要运用到了多模态语义分析、人脸识别、知识图谱等技术。在判断视频质量上,会通过各种模型对图像、声音、内容等进行多维度、分级别的质量识别与评价。
由于演讲的内容庞杂,本文无法全部总结,演讲的视频和 PPT 后续会陆续发布到 AICUG 的官网上,感兴趣的同学可以关注。
AICUG 人工智能技术社区成立于 2018 年 3 月,是一家专注服务于 AI 行业的国际化社区交流平台。AICUG 的使命是做 AI 技术的国际传播使者,推动中国 AI 产业进步、国际化;核心功能是传播国际顶尖 AI 技术,面向海内外人工智能企业及开发者,服务 AI 产业链上下游及周边企业,对接海内外项目、人才、技术;核心价值是 AI 垂直领域分享,通过多种互动产品和形式最大化传播 AI 先进技术;核心优势是人才、技术、知识资源整合,汇聚全球 AI 行业顶尖技术专家、教授,以及优秀技术开发者。
评论