在QCon广州2019大会上,张力柯讲师做了《从 Darknet 到 Tensorfow: 图像识别一站式平台的工程实践》主题演讲,主要内容如下。
演讲简介:
基于深度学习的计算机视觉是 AI 技术在现实场景的重要应用方向之一,被广泛用于交通管理、无人驾驶、安全监控等领域。然而由于其技术门槛较高,图像识别仍然属于少数研究人员的专属,体现在以下几点:各种新概念层出不穷,掩盖了真实业务的痛点;越来越复杂的神经网络需要强大的 GPU 集群支持,而现实中并非每家公司都有 Google 的强大算力;真正落地的视觉产品需要整合图像标注、模型定义、训练、部署及服务接口等多个步骤,是一个复杂的系统设计问题而非纯算法问题;部分基于 C/C++ 的代码实现,如 Yolo 的 Darknet,难以拓展到真实生产环境下,充分利用现代开发框架如 Tensorflow 等在分布式处理和资源调度上的优势。在这里我们基于腾讯互娱 Turing Lab 近两年将前沿算法和实际项目需求结合的实践经验, 以 YoloV3 的部署和应用为例,探讨一个真正落地的图像识别系统从单机原型开发到基于分布式集群部署和应用的完整演化过程。
听众受益:
前沿计算机视觉研究目标和实际业务需求的差异;
前沿 AI 算法在实际工程项目中存在的问题;
图像识别平台各环节的痛点和解决方案。
讲师介绍:
张力柯
腾讯互娱 品质管理部 Turing Lab 副总监
毕业于美国德克萨斯大学圣安东尼奥分校并获得计算机科学博士学位,曾先后在美国微软、BCG、Uber 及硅谷其他创业公司担任过从研发工程师到项目负责人等多个岗位,在操作系统内核、网络安全、搜索引擎、推荐系统、大规模分布式系统、图像处理、数据分析等领域具有丰富经验。2017 年归国后在腾讯游戏品质管理部创建 Turing Lab,负责探索前沿 AI 技术在游戏评测分析及相关领域的实际应用和产品研发。
完整演讲 PPT 下载链接:
https://qcon.infoq.cn/2019/guangzhou/schedule
评论