在AICon北京2018大会上,李永会讲师做了《嵌入式深度学习框架研发与落地实践》主题演讲,主要内容如下。
演讲简介:
深度学习技术已经在互联网的诸多方向产生影响。该技术近几年在嵌入式领域也得到飞速发展,各种互联网产品都争相在端侧应用深度学习技术,产品对深度学习的引入也将进一步影响用户体验。随着移动设备被广泛使用,在移动互联网产品应用深度学习和神经网络技术已经成为必然趋势。
在移动端应用深度学习技术时往往存在各种各样的问题,由于移动端设备的性能以及包体积、耗电、内存都有很大的局限,这就为深入全面落地相关技术框架带来了很大难度。本次演讲主要从硬件面对的困难讲起,再到落地应用层面的问题解决,以简单搜索 App 为案例全面讲解从汇编到顶层架构实现。
演讲提纲:
移动端 AI 现状
Paddle-Mobile 介绍
Paddle-Mobile CPU 性能优化
CPU 优化落地简单搜索 APP 场景案例
Paddle-Mobile GPU 性能优化
GPU 优化落地简单搜索 APP 场景案例
FPGA、NPU 等协处理器方案
Paddle-Mobile 硬件支持架构描述
简单搜索创新体验介绍
听众收益:
从中可以了解到当下移动端 AI 框架的格局和发展情况
Paddle-Mobile 做为百度移动端唯一深度学习框架的 ARM CPU 和 Mali\Andreno GPU 的性能优化
对体系结构和硬件知识也可以有一定的深入了解
讲师介绍:
李永会
百度 多模搜索部资深工程师
百度大搜索客户端架构师,主要研究方向是嵌入式方向超算性能挑战,对于 Andreno GPU 和 Mali GPU 以及 ARM CPU 投入较多精力研究。目前负责图像搜索相关技术工作,主持移动端深度学习框架 Paddle-Mobile 的研发工作。重点关注嵌入式领域的硬件和体系结构相关研究。工作成果在百度 APP 和简单搜索 APP 多个大型线上 APP 应用。
完整演讲 PPT 下载链接:
https://aicon.infoq.cn/2018/beijing/#schedule
评论