QCon北京「鸿蒙专场」火热来袭!即刻报名,与创新同行~ 了解详情
写点什么

TensorFlow 技术发展与落地实践

  • 2019-03-13
  • 本文字数:2982 字

    阅读完需:约 10 分钟

TensorFlow技术发展与落地实践

本次分享的主要内容包括以下四个方面:首先是深度学习简介;其次是 TensorFlow 简介;然后讲解了深度学习在服装设计方向的机会与挑战;最后重点介绍深度学习的落地实践。


一、 深度学习简介

1.1 深度学习的发展

阿尔法围棋(AlphaGo)是第一个击败人类职业围棋选手、第一个战胜围棋世界冠军的人工智能机器人, 从 AlphaGo 开始, 人工智能正式走入了大众的视野, 在 10 月 18 日,AlphaGo 的父亲 DeepMind 团队推出了 AlphaGo Zero,从 0 训练用了 40 天时间,以 100:0 击败了当今的世界围棋第一 AlphaGo,AlphaZero 在去年底通过自我对弈,就完爆上一代围棋冠军程序 AlphaGo,且没有采用任何的人类经验作训练数据,不管是 AlphaGo 还是 AlphaGo 他们的原理都是深度学习。


1.2 深度学习的动机

计算机语言一般都是按照固定流程完成任务,但是有一些任务,比如下五子棋、无人驾驶,人脸识别等,很难把他们的流程描述出来。这个时候就需要用到人工智能的方式来实现这些流程不确定的工作。


1.3 深度学习的原理

深度学习是指训练神经网络,把样本 x 输入神经网络,每一个特征都与所有的神经元相互联系,通过习得一个函数,映射到输出 y。



神经网络的结构包含输入层、隐藏层、输出层三部分,以判断零件是否合格为例,一个神经网络可以是输入层输入零件的长度和零件的质量,把参数权重 w、偏置 b 和输入 x 做 wx+b 运算,再通过激活函数激活得到神经元的值传到输出层,如果输出大于 0 则零件是合格,否则不合格。


输入层(Input layer),众多神经元接受大量非线形输入 x。输入的 x 称为输入向量。


输出层(Output layer),x 在神经元链接中传输、分析,形成输出结果。输出的 x 称为输出向量。


隐藏层(Hidden layer),简称“隐层”,是输入层和输出层之间众多神经元和链接组成的各个层面。

1.4 深度学习的案例

神经网络在自然语言上的应用:


情感分类:理解情感的语义,先把文字抽象成特征向量,把特征向量输入到神经网络,经过一系列的运算得到正负值,正代表着好评,负代表着差评。



神经网络在图像上的应用:手写数字识别、目标检测


输入图片得到像素矩阵,然后把像素矩阵输入到神经网络,进行目标检测,目标识别,识别出图片中的人、狗和椅子,手写数字也是同理。



目前 google 也在使用深度学习的方式来做推荐:


1.5 深度学习的趋势

可以看出从 2012 开始,深度学习的热度持续增高,一直到 2017 年都处于持续增长状态。2015 年国内开始兴起人工智能,到 2018 年,经过这三年的发展,人工智能的技术已经得到很好的发展,在各种细分的领域得到很好的应用。


二、TensorFlow 简介

2.1 TensorFlow 的前身

TensorFlow 是一个实现深度学习的框架,两者相辅相成,互为基础,他的前身是 DistBelief,DistBelief 只支持 CPU,原因是 google 内部的 CPU 资源非常丰富,可以通过并行的方式,实现高速度。


2.2 TensorFlow 介绍

DistBelief 后来发展为了 TensorFlow,TensorFlow 不依赖 Google 内部系统和架构,能够支持 GPU。

2.3 TensorFlow 早期版本变化

TensorFlow 不断的再创新,增加新功能,迭代速度是非常快的。



从 2015 年以后,TensorFlow 的流行度远超其他深度学习框架。



四款常用的深度学习框架比较:早期的时候图像的框架多用 caffe,但是 TensorFlow 的学习资料会更多一些,所以刚入门的新手推荐用 TensorFlow。


三、深度学习在服装设计方向的机会与挑战

3.1 深度学习落地行业

随着深度学习的发展,深度学习已经和很多行业结合起来,比如 AI+金融,AI+医疗等,但是在服装设计行业还很少,就目前来说,AI+服装行业还是一片蓝海。


3.2 服装设计行业存在的难题

国内的时尚一直以来都是紧跟欧美时尚,国内的服装设计师通过不断的寻找欧美的时尚素材,然后进行二次创造,但是创作的过程存在两个问题,一是时尚素材过于散,查找困难,二是设计师难以理解淘宝上的相关服装数据,没办法利用这些数据服务于设计,这也是知衣科技想要解决的问题,知衣科技是一家 AI 电商解决方案提供商,利用图像识别、个性化推荐等人工智能技术为电商行业提供人工智能解决方案,辅助设计师完成服装设计。



下图是淘宝的数据工具:


3.3 服装设计问题

1)多源:如果有上千个品牌方,就有上千个官网,还有很多的时尚网站,如何去收集这些信息其实是一个难点。


2)异构:设计师需要参考的既有图像类的非结构化数据,也有文字这样的半结构化数据,还有交易结构化数据,如何将这些数据有机的串联起来存在挑战。


3)海量:在互联网上有上百亿的服装信息,上亿的商品交易信息。


如何去处理这些图片、文字、交易信息,去帮助设计师去选款是知衣科技要解决的问题。


四、深度学习的落地实践

4.1 标签问题和解决办法

深度学习的识别和分类都是比较成熟的技术,但是如何把这些技术应用到服装行业确是一个新的问题。目前时尚图片的标注数据准确率低,因为时尚是一个专业性的东西,并不是每一个人都能理解时尚,所以很难标注,知衣科技的标注是由服装学院的设计师们帮忙标注的, 标注的准确率很高。


在服装识别中,我们把服装分为了五大类:上衣、下衣、包、鞋子、连衣裙, 再对五大类做细分,总共有 150 多种标签,设计师需要的是更细的划分,比如前几年流行的一字肩,这种细节需要从大量的数据中去发现。



目前标签存在的两大问题,一是标签的稀疏性,有的标签会比较少,比如双面呢大衣,二是设计细节难打标签,比如袖口的拉链,口袋的开口方向等,会有漏打漏标的情况,所以整体的标签要治理出来是非常困难的,我们开发了一套专门针对服装标签的打标系统,在部分标签体系上能实现 93%到 95%的识别率,设计院校的学生的识别率在 85%-90%,在这个专业领域上已经比别人强了。


4.2 基于 Faster R-CNN Model 的目标检测

整体的网络构造分两层,第一层是 Faster R-CNN 识别服装的过程,第二层是把识别到的服装经过一些风格的过滤器, 输出到不同的 FeatureMap 里,有些是形态的,有些是风格的,然后根据不同的风格进行聚类,再针对这些问题去做回归。



对图片进行多个维度的识别,包括人脸识别,包括以图搜图,搜图目的不同,他们背后的算法、逻辑和训练方式也是不一样的,比如淘宝的找同款或找相似,而我们要解决的是设计师选错款的问题,理解设计师想找到什么图片,这个问题我们抽象成了两个场景,一是全图搜索,看重的是整体的搭配,二是品类相似,是找单品相似款式。


作者介绍

郑泽宇知衣科技联合创始人兼 CEO。国内第一本 TensorFlow 读物《TensorFlow:实战 Google 深度学习框架》作者,该书销量稳居京东人工智能榜前 3。归国创业之前,郑泽宇曾任美国谷歌高级工程师。从 2013 年加入 Google,作为主要技术人员参与并领导了多个大数据项目。由他提出并主导的产品聚类项目用于衔接谷歌购物和谷歌知识图谱(Knowledge Graph)数据,使得知识卡片形式的广告逐步取代传统的产品列表广告,开启了谷歌购物广告在搜索页面投递的新纪元。 2013 年 5 月获得美国 Carnegie Mellon University 大学语言技术研究所硕士学位。期间在国际会议上发表数篇学术论文,并被评为 Siebel Scholar。此项荣誉每年仅授予 105 位全球顶级研究生。2011 年毕业于北京大学信息科学与技术学院,荣获北大优秀毕业生称号及信息科学与技术学院十佳毕业论文。郑泽宇在机器学习、人工智能领域有多年研究经验,并在 SIGIR、ACL、ICDM、ICWSM 等顶级国际会议上发表多篇学术论文。


本文来自郑泽宇在 DataFun 社区的演讲,由 DataFun 编辑整理。


2019-03-13 08:004136

评论

发布
暂无评论
发现更多内容

java毕设开发经典选题

清风

毕业设计

电商系统微服务拆分-模块6

小牧ah

架构实战营

详解可观测性监控系统中的“金三角”

尔达Erda

开源 微服务 运维 云原生 APM

挑战倒计时!“互联网+”大赛华为命题加速高阶能力提升

华为云开发者联盟

华为云 鲲鹏 大赛 “互联网+” 昇腾AI

如何找到靠谱的工长?

escray

生活记录 8月日更 装修记

架构训练营模块六作业

喻高咏        

架构实战营

Spark 源码阅读 02:从 Spark-Submit 到 Driver 启动

程序员赤小豆

spark 技术 Spark 源码

用户体验再升级!Erda 1.2 版本正式发布

尔达Erda

云计算 开源 开发者 云原生 Go 语言

【架构训练营】模块六作业

zclau

Spark 源码阅读 01:环境搭建

程序员赤小豆

spark 技术 Spark 源码

从头配置阿里云服务器

阿Q说代码

SSL证书 8月日更 阿里云服务器 域名备案

kubernetes增加Node详细步骤

消失的子弹

Kubernetes 云原生 k8s kubeadm

百度地图开发-在地图上实现路线导航 09

Andy阿辉

android Android 小菜鸟 Android端 8月日更

你知道 JavaScript 中的 Arguments 对象都有哪些用途吗?

编程三昧

JavaScript 大前端 函数 8月日更 Arguments

Rust从0到1-高级特性-类型进阶

rust 高级特性 类型 Types

苏宁精准测试方案探索和实践

薛飞

精准测试

面向多场景而设计的 Erda Pipeline

尔达Erda

开源 微服务 云原生 企业数字化转型 Go 语言

索引下推,这个点你肯定不知道!

艾小仙

MySQL MySQL 高可用

Regan Yue带你一起学习微软AZ-900认证的有关知识「 第V章」

Regan Yue

微软 8月日更 AZ-900

架构实战营第一期--模块六作业

clay

架构实战营

微信业务架构&学生系统管理系统设计

Geek_dae

架构实战营

技术调研,IDEA 插件怎么开发「脚手架、低代码可视化编排、接口生成测试」?

小傅哥

Java 小傅哥 低代码 IDEA 脚手架

云原生时代的 APM

尔达Erda

微服务 运维 云原生 APM 应用性能管理

云小课|ModelArts Pro 视觉套件 零代码构建视觉AI应用

华为云开发者联盟

AI ModelArts Pro EI智能体 视觉套件

快速生成好看实用的接口文档

与风逐梦

后端 接口文档

书单 | 8月新书榜单TOP10,快来看看都有谁吧~~

博文视点Broadview

架构实战营模块 6 作业

蔸蔸

拆分电商系统为微服务

木云先森

架构实战营

情窦初开,原来喜欢这么可爱的

4ye

Python 后端 8月日更 词云

Vue进阶(八十四):Computed 和 Watch 使用与区别

No Silver Bullet

Vue 8月日更

AI应用说-生产制造专场开课啦!

百度大脑

人工智能

TensorFlow技术发展与落地实践_框架_DataFunTalk_InfoQ精选文章