在QCon上海2018大会上,周大江讲师做了《端侧 AI 及其在蚂蚁金服场景的落地》主题演讲,主要内容如下。
演讲简介:
以深度学习为代表的 AI 技术已经在图像、语音、自然语言等领域得到了广泛的应用。部署在移动终端本地的 AI 算法在实时性、隐私性和成本方面都相对云侧 AI 有着天然的优势,在很多场景下,在端到端精度上也能形成优势。然而,受制于终端有限的资源,端侧 AI 在算力和存储空间上都面临着技术挑战。对于包括支付宝在内的超级 App 来说,由于极广的用户覆盖和业务场景,这些挑战被进一步放大,同时也对研发效率提出了更高的要求。在我们看来,极致的端侧 AI 能力来自于算法与工程实现的深度整合。本讲将重点分享以下几个方面:
算法层,深度学习模型压缩与加速技术,包括权重稀疏化与离散化、通道剪裁、卷积分组、网络结构搜索等。
实现层,深度学习预测引擎的优化,包括缓存优化、多线程调度,整型计算、异构计算等。
蚂蚁金服为端侧 AI 业务的快速落地建设的研发支撑体系,以及业务案例。
讲师介绍:
周大江
蚂蚁金服 多媒体产品技术部高级算法专家
周大江,目前在蚂蚁金服多媒体产品技术部担任高级算法专家,兼任日本法政大学客座副教授。在此之前,他分别于上海交通大学和日本早稻田大学取得硕士与博士学位后,于早稻田大学担任助理教授一职。他的研究兴趣包括:深度学习、视频编解码、高性能计算、芯片设计等。发表论文 100 多篇,获得、申请专利 10 多项。历任 A-SSCC, ASP-DAC 等国际会议的程序委员会委员,为 20 余本 SCI 期刊担任审稿人,并曾主持 3 项日本文部省基金项目,研制了世界首款支持 8K 清晰度的单芯片视频解码器。他获得的奖项包括:ISSCC Takuo Sugano Award、VLSI Circuits Symposium Best Student Paper Award、早稻田大学研究奖、日本学术振兴会研究员资助、中国自费留学生奖学金等。
完整演讲 PPT 下载链接:
https://qcon.infoq.cn/2018/shanghai/schedule
评论