写点什么

TensorFlow 技术发展与落地实践

  • 2019-03-13
  • 本文字数:2982 字

    阅读完需:约 10 分钟

TensorFlow技术发展与落地实践

本次分享的主要内容包括以下四个方面:首先是深度学习简介;其次是 TensorFlow 简介;然后讲解了深度学习在服装设计方向的机会与挑战;最后重点介绍深度学习的落地实践。


一、 深度学习简介

1.1 深度学习的发展

阿尔法围棋(AlphaGo)是第一个击败人类职业围棋选手、第一个战胜围棋世界冠军的人工智能机器人, 从 AlphaGo 开始, 人工智能正式走入了大众的视野, 在 10 月 18 日,AlphaGo 的父亲 DeepMind 团队推出了 AlphaGo Zero,从 0 训练用了 40 天时间,以 100:0 击败了当今的世界围棋第一 AlphaGo,AlphaZero 在去年底通过自我对弈,就完爆上一代围棋冠军程序 AlphaGo,且没有采用任何的人类经验作训练数据,不管是 AlphaGo 还是 AlphaGo 他们的原理都是深度学习。


1.2 深度学习的动机

计算机语言一般都是按照固定流程完成任务,但是有一些任务,比如下五子棋、无人驾驶,人脸识别等,很难把他们的流程描述出来。这个时候就需要用到人工智能的方式来实现这些流程不确定的工作。


1.3 深度学习的原理

深度学习是指训练神经网络,把样本 x 输入神经网络,每一个特征都与所有的神经元相互联系,通过习得一个函数,映射到输出 y。



神经网络的结构包含输入层、隐藏层、输出层三部分,以判断零件是否合格为例,一个神经网络可以是输入层输入零件的长度和零件的质量,把参数权重 w、偏置 b 和输入 x 做 wx+b 运算,再通过激活函数激活得到神经元的值传到输出层,如果输出大于 0 则零件是合格,否则不合格。


输入层(Input layer),众多神经元接受大量非线形输入 x。输入的 x 称为输入向量。


输出层(Output layer),x 在神经元链接中传输、分析,形成输出结果。输出的 x 称为输出向量。


隐藏层(Hidden layer),简称“隐层”,是输入层和输出层之间众多神经元和链接组成的各个层面。

1.4 深度学习的案例

神经网络在自然语言上的应用:


情感分类:理解情感的语义,先把文字抽象成特征向量,把特征向量输入到神经网络,经过一系列的运算得到正负值,正代表着好评,负代表着差评。



神经网络在图像上的应用:手写数字识别、目标检测


输入图片得到像素矩阵,然后把像素矩阵输入到神经网络,进行目标检测,目标识别,识别出图片中的人、狗和椅子,手写数字也是同理。



目前 google 也在使用深度学习的方式来做推荐:


1.5 深度学习的趋势

可以看出从 2012 开始,深度学习的热度持续增高,一直到 2017 年都处于持续增长状态。2015 年国内开始兴起人工智能,到 2018 年,经过这三年的发展,人工智能的技术已经得到很好的发展,在各种细分的领域得到很好的应用。


二、TensorFlow 简介

2.1 TensorFlow 的前身

TensorFlow 是一个实现深度学习的框架,两者相辅相成,互为基础,他的前身是 DistBelief,DistBelief 只支持 CPU,原因是 google 内部的 CPU 资源非常丰富,可以通过并行的方式,实现高速度。


2.2 TensorFlow 介绍

DistBelief 后来发展为了 TensorFlow,TensorFlow 不依赖 Google 内部系统和架构,能够支持 GPU。

2.3 TensorFlow 早期版本变化

TensorFlow 不断的再创新,增加新功能,迭代速度是非常快的。



从 2015 年以后,TensorFlow 的流行度远超其他深度学习框架。



四款常用的深度学习框架比较:早期的时候图像的框架多用 caffe,但是 TensorFlow 的学习资料会更多一些,所以刚入门的新手推荐用 TensorFlow。


三、深度学习在服装设计方向的机会与挑战

3.1 深度学习落地行业

随着深度学习的发展,深度学习已经和很多行业结合起来,比如 AI+金融,AI+医疗等,但是在服装设计行业还很少,就目前来说,AI+服装行业还是一片蓝海。


3.2 服装设计行业存在的难题

国内的时尚一直以来都是紧跟欧美时尚,国内的服装设计师通过不断的寻找欧美的时尚素材,然后进行二次创造,但是创作的过程存在两个问题,一是时尚素材过于散,查找困难,二是设计师难以理解淘宝上的相关服装数据,没办法利用这些数据服务于设计,这也是知衣科技想要解决的问题,知衣科技是一家 AI 电商解决方案提供商,利用图像识别、个性化推荐等人工智能技术为电商行业提供人工智能解决方案,辅助设计师完成服装设计。



下图是淘宝的数据工具:


3.3 服装设计问题

1)多源:如果有上千个品牌方,就有上千个官网,还有很多的时尚网站,如何去收集这些信息其实是一个难点。


2)异构:设计师需要参考的既有图像类的非结构化数据,也有文字这样的半结构化数据,还有交易结构化数据,如何将这些数据有机的串联起来存在挑战。


3)海量:在互联网上有上百亿的服装信息,上亿的商品交易信息。


如何去处理这些图片、文字、交易信息,去帮助设计师去选款是知衣科技要解决的问题。


四、深度学习的落地实践

4.1 标签问题和解决办法

深度学习的识别和分类都是比较成熟的技术,但是如何把这些技术应用到服装行业确是一个新的问题。目前时尚图片的标注数据准确率低,因为时尚是一个专业性的东西,并不是每一个人都能理解时尚,所以很难标注,知衣科技的标注是由服装学院的设计师们帮忙标注的, 标注的准确率很高。


在服装识别中,我们把服装分为了五大类:上衣、下衣、包、鞋子、连衣裙, 再对五大类做细分,总共有 150 多种标签,设计师需要的是更细的划分,比如前几年流行的一字肩,这种细节需要从大量的数据中去发现。



目前标签存在的两大问题,一是标签的稀疏性,有的标签会比较少,比如双面呢大衣,二是设计细节难打标签,比如袖口的拉链,口袋的开口方向等,会有漏打漏标的情况,所以整体的标签要治理出来是非常困难的,我们开发了一套专门针对服装标签的打标系统,在部分标签体系上能实现 93%到 95%的识别率,设计院校的学生的识别率在 85%-90%,在这个专业领域上已经比别人强了。


4.2 基于 Faster R-CNN Model 的目标检测

整体的网络构造分两层,第一层是 Faster R-CNN 识别服装的过程,第二层是把识别到的服装经过一些风格的过滤器, 输出到不同的 FeatureMap 里,有些是形态的,有些是风格的,然后根据不同的风格进行聚类,再针对这些问题去做回归。



对图片进行多个维度的识别,包括人脸识别,包括以图搜图,搜图目的不同,他们背后的算法、逻辑和训练方式也是不一样的,比如淘宝的找同款或找相似,而我们要解决的是设计师选错款的问题,理解设计师想找到什么图片,这个问题我们抽象成了两个场景,一是全图搜索,看重的是整体的搭配,二是品类相似,是找单品相似款式。


作者介绍

郑泽宇知衣科技联合创始人兼 CEO。国内第一本 TensorFlow 读物《TensorFlow:实战 Google 深度学习框架》作者,该书销量稳居京东人工智能榜前 3。归国创业之前,郑泽宇曾任美国谷歌高级工程师。从 2013 年加入 Google,作为主要技术人员参与并领导了多个大数据项目。由他提出并主导的产品聚类项目用于衔接谷歌购物和谷歌知识图谱(Knowledge Graph)数据,使得知识卡片形式的广告逐步取代传统的产品列表广告,开启了谷歌购物广告在搜索页面投递的新纪元。 2013 年 5 月获得美国 Carnegie Mellon University 大学语言技术研究所硕士学位。期间在国际会议上发表数篇学术论文,并被评为 Siebel Scholar。此项荣誉每年仅授予 105 位全球顶级研究生。2011 年毕业于北京大学信息科学与技术学院,荣获北大优秀毕业生称号及信息科学与技术学院十佳毕业论文。郑泽宇在机器学习、人工智能领域有多年研究经验,并在 SIGIR、ACL、ICDM、ICWSM 等顶级国际会议上发表多篇学术论文。


本文来自郑泽宇在 DataFun 社区的演讲,由 DataFun 编辑整理。


2019-03-13 08:004084

评论

发布
暂无评论
发现更多内容

Netty源码解析 -- 服务端启动过程

binecy

Netty nio

【高并发】秒杀系统架构解密,不是所有的秒杀都是秒杀(升级版)!!

冰河

并发编程 高并发 架构设计 秒杀 异步

JAVA中的内部类详解

倔强的攻城狮

Java

Kubeless 架构设计 | 玩转 Kubeless

donghui

Serverless kubeless

MySQL-技术专题-mysql的联合索引

洛神灬殇

学习笔记:架构师训练营-第四周

四夕晖

高并发 系统架构演化

MySQL-技术专题-事务和并发一致性问题

洛神灬殇

图解超难理解的 Paxos 算法(含伪代码)

多颗糖

分布式 算法 分布式系统 架构师 一致性算法

中国首个“芯片大学”即将落地;生成对抗网络(GAN)的数学原理全解

京东科技开发者

技术 网络 GAN 芯片

都别拦着我,我要删库了

MySQL从删库到跑路

Linux oracle重装 MySQL 运维 root

打破区块链游戏经济的隔阂,或许该从跨游戏资产入手

CECBC

区块链 游戏

浅析:线程安全

朱华

Java 多线程与高并发

架构师训练营第 1 期 - 第四周课后练习

Anyou Liu

极客大学架构师训练营

《谛听说智能》迎来圆满落幕,企业降本增效新指南

Geek_e670ab

第四周 作业二:系统架构学习总结【未陌】

a d e

系统架构 互联网架构

Week 2 学习总结

balsamspear

极客大学架构师训练营

mybatis plus 自动更新数据库时间的小坑

废材姑娘

Java mybatis

读——沟通的艺术,看入人里,看出人外(第三章)

废材姑娘

当我在听播客时,我在听什么?

Nydia

深拷贝链表,python处理音频信号和数字信号、vim教程、swift单元测试和UI测试 John 易筋 ARTS 打卡 Week 21

John(易筋)

单元测试 ARTS 打卡计划 python 数字信号 vim教程 深拷贝链表

后疫情时期,看区块链如何赋能文创产业加快经济复苏?

CECBC

区块链技术 文创产业

甲方日常 29

句子

工作 随笔杂谈 日常

Week 2命题作业

balsamspear

极客大学架构师训练营

IDEA常用设置、快捷键及代码模板

jiangling500

IDEA

反向保理系统设计

森林

有状态的服务其实可以做更多的事情

架构师修行之路

分布式 微服务

第四周 作业一:系统架构【未陌】

a d e

系统架构

kubernetes是微服务发展的必然产物

架构师修行之路

Kubernetes 分布式 微服务

数字经济2.0—趋势、逻辑、选择

CECBC

区块链 数字经济

MySQL-技术专题-解决死锁问题

洛神灬殇

头条终面:写个消息中间件

yes

面试 消息队列

TensorFlow技术发展与落地实践_框架_DataFunTalk_InfoQ精选文章