产品战略专家梁宁确认出席AICon北京站,分享AI时代下的商业逻辑与产品需求 了解详情
写点什么

打造视觉智能引擎,AI 识货赋能商品数字化 | StartDT AI Lab

  • 2019-09-16
  • 本文字数:2314 字

    阅读完需:约 8 分钟

打造视觉智能引擎,AI识货赋能商品数字化 | StartDT AI Lab



自零售领域近些年围绕转型升级建设性地提出了以“人、货、场”三核心为基础的新零售蓝图之后,各方新技术蜂拥在零售的各型场景中角力。在之前的分享中,我们主要介绍了如何通过人工智能技术,从“人”的维度切入零售场景的。而本文将着重介绍我们(奇点云)自研的人工智能技术是如何从“货”的维度赋能零售商业的。


视觉智能引擎作为 AI 落地的第一步,在商品数字化方面发挥着主要作用。而从视觉角度来说,“货”的形态差异相较于“人”来说有了显著增加。不同的垂直行业为顺应市场需求所开发的产品,无论在产品功能还是形态上都千差万别,甚至同类型产品也会产生出不同的形态以顺应差异化的细分需求。这对视觉智能引擎提出了新的挑战,也激发出了 StartDT AI Lab(注,「StartDT AI Lab 」栏目致力于展现奇点云在算法技术上的突破,分享算法研发成果在商业场景的应用能力,专注于“AI+大数据”领域。)更大的技术突破。


下面从已经商业落地的场景中选了几个比较有代表性的行业场景来展示 StartDT AI Lab 已取得的技术突破。

AI 识货赋能服饰行业

我们在 17 年率先推出服装识别技术,结合产品——奇点魔镜实现落地。在这个场景中,用户站在奇点魔镜前站定几秒后,奇点魔镜首先将对用户的穿着进行分割理解,从中分离出 T 恤、风衣、夹克、牛仔裤等各种类型的服饰,然后通过对单品服饰的分析,例如 T 恤,我们可以对其抽取特征,分析出 T 恤的风格、袖长、版型等属性,最后在我们自建的百万级服饰商品库中,使用推荐算法为用户推荐相似的、配套的商品,从而达到引流客户、智能导购的效果。



在这个链路中,我们当时碰到的主要问题和解决方案:


  • 1.获取用户准确的衣着信息并获取特征时,像 T 恤、短裤这样上下装明显的衣着较容易获取,但像连衣裙、风衣类较长的衣着却较难处理。我们通过收集大量数据、清洗打标、完善数据集,并使用级连方法,先对服饰一级标签进行检测分析,再进行二次处理,从而提高了分割效果。

  • 2.服饰属性多样且没有统一的标准,如何快速同时判断成为难题。我们将属性的分类器各自独立互不影响,使用特征作为输入,减少了重复运算,另外我们将分类器同时接在 Graph 中,使整体过程 End-to-End,快速有效。

  • 3.大规模检索:当数据库较大时,检索速度慢,无法快速响应。我们将比对数据库部署在分布式集群上,实现了特征比对层面的 map-reduce,使我们在应对各种级别的比对时游刃有余。

AI 识货赋能快消饮品行业

我们在快消饮品行业已有近两年的探索历史。各式各样的饮品——包括矿泉水、碳酸饮料、果汁、啤酒、白酒等都可以在奇点魔柜中售卖。我们通过自研的深度学习算法、数据采样方法,配合我们定制化的硬件配置,实现了在商用场景中 99%以上的识别准确率。我们将货损率控制在 1%以内,低于快消饮品行业平均货损水平。此外,我们在不到 1 平米的占地空间上实现了极高的坪占比,单柜单月零售额可达千元级别,却仅需少量的维护工作。



在正式商用的背后,StartDT AI Lab 主要的 contribution 有以下几点:


No.1 快速有效的小物体检测算法


和大多数场景不同,我们的检测目标往往是最小边接近 16 像素的小目标,且在一张图上有相当多的目标。我们通过自适应 anchor 的方法,使先验 anchor 更加准确;此外我们通过一种特征增强算法,使细节特征得以在深度网络中尽可能减少损失,从而避免了因特征过少带来的低分值检测结果不稳定的问题。此外我们还自研了一种自蒸馏方法,在不增加参数的情况下提升了模型准确率,从而达到了商用水准。


No.2 与度量学习结合的识别技术


度量学习在过去的几年中被广泛使用在人脸识别模型上,并取得了非常不错的效果。我们将其引入商品识别,结合经典的神经网络方法,使识别结果更加准确可靠;此外模型还可输出可比对特征,支持特征比对方式出结果,支持不同类间相似比较,从而在选品层面就避免了相似商品同时售卖无法识别的问题。


No.3 小数据集增强


我们的数据集相对使用场景,其实是一个小数据集。如何使用小数据集在大数据场景下获得商用级准确度?我们自研了一种 mix 方法,使检测模型获得了非常高的召回率;此外我们还使用了 GAN,在训练分类器的过程中同时训练生成器,再拿生成结果同时训练分类器,使分类器训练更充分,更平滑。


在生鲜/药品等垂直领域,我们也敢于摸索和尝试,发挥自有深度学习算法和采样方法的优势,结合自研的硬件优点,首创能将繁复多类的生鲜不受类别影响的智能货柜。众所周知,在垂直领域中,同一 sku 的外观变化多样,适配成本高。我们通过特定产品设计,完美支持各类蔬菜水果等生鲜,准确率更是可以做到近乎 100%。让顾客不受限于菜市场/药房等特殊场地的限制同时,更可以发挥无人货柜的完美优势——不受时间限制。





StartDT AI Lab 在黑暗中探索的收获与创新:


No.1 新颖的深度学习式场景思考


为了摆脱生鲜场景下,各种形状和尺寸带来的异同和难以兼容,以及客户快速上新的切实需求,我们在场景落地的实际道路上,结合商品的特性、产品的优势和深度学习算法的原理,给奇形怪状的生鲜产品进行特殊的包装,该方案解决了生鲜产品之间的差异性,并能支持客户快速上新。


No.2 独具创新特色的数据增广


光有新颖的方案设计还不足以让深度学习在一个实际场景中完美落地,准确率是客户第一要素,数据是深度学习的资本。StartDT AI Lab 在深入分析了生鲜和药品等垂直领域的数据特性和算法性能之后,创新性地在采样数据集上进行数据增广,让准确率近乎完美,诠释了什么是将深度学习进行落地的概念。


从以上案例中,呈现了 StartDT AI Lab 在“货”的数字化探索,虽然还是比较初步的商品数字化阶段,但也通过 AI 技术首次实现了商品售卖周期内的全链路数字化跟踪,并在此基础上实现了零售前端成本削减,提高了用户调研自动化的效率。


2019-09-16 17:251345

评论

发布
暂无评论
发现更多内容

阿里RocketMQ创始人首次分享出这份RocketMQ技术内幕神级架构手册

做梦都在改BUG

Java RocketMQ 消息队列 消息中间件

屌的一批!阿里P8推荐的Spring Cloud实战笔记

小小怪下士

Java 微服务 SpringCloud

厦门等保备案平台是哪个?多久可以办好?

行云管家

等保备案 厦门

ShareSDK Google平台注册指南

MobTech袤博科技

神了!阿里P8级数据库专家手写出了这份438页数据库高效优化手册

做梦都在改BUG

Java 数据库 sql 性能优化

不愧是阿里内部新产springboot实战派文档!干货满满,不讲一句废话

采菊东篱下

微服务

anyRTC快对讲融合通信指挥调度平台

anyRTC开发者

音视频 融合通信 快对讲 视频监控 综合调度

iOS MachineLearning 系列(6)—— 视频中的物体轨迹分析

珲少

Spring Cloud Stream:打造强大的微服务事件驱动架构

做梦都在改BUG

Java 微服务 spring cloud stream

灵活、快捷、低运维成本的数据集成方法:数据联邦架构

星环科技

数据集成 数据联邦结构

超级App的构建与技术驱动

没有用户名丶

分布式计算技术(上):经典计算框架MapReduce、Spark 解析

星环科技

分布式计算

分布式计算技术(下):Impala、Apache Flink、星环Slipstream

星环科技

分布式计算 Slipstream

面试官:HashMap线程不安全体现在哪里?

做梦都在改BUG

在高校内投放共享电单车有什么优势

共享电单车厂家

共享电动车厂家 景区共享电单车 共享电单车投放 校内共享电单车 共享电单车优势

分析型数据库:分布式分析型数据库

星环科技

分析型数据库

【Python实战】Python采集大学教务系统成绩单

BROKEN

三周年连更

支持多模型数据分析探索的存算分离湖仓一体架构解析(上)

星环科技

湖仓一体

分布式场景下,Apache YARN、Google Kubernetes 如何解决资源管理问题?

星环科技

资源管理 Apache YARN

星环科技自研技术,加速大数据从持久化、统一化、资产化、业务化到生态化

星环科技

大数据

AppleParty(苹果派)v3 支持 App Store 新定价机制 - 批量配置自定价格和销售范围

37手游iOS技术运营团队

In App Purchase AppleParty App Store Connect API 批量创建内购IAP app store

python游戏开发-pgzero

AIWeker

Python python小知识 三周年连更

代码重构:面向单元测试

阿里技术

宝塔人机识别验证:如何确保人脸识别的安全性?

百度开发者中心

人脸识别 人工智能’

支持多模型数据分析探索的存算分离湖仓一体架构解析(下)

星环科技

湖仓一体

Github星标120k!这份阿里独有的高并发实战笔记太强了!

做梦都在改BUG

Java redis zookeeper Netty 高并发

iSulad+Kuasar:管理面资源消耗锐减 99%的新一代统一容器运行时解决方案

openEuler

Linux 容器 云原生 操作系统 Kubernetes Serverless

分析型数据库:MPP 数据库的概念、技术架构与未来发展方向

星环科技

MPP数据库

度量分析开源社区健康度,助力企业开源生态健康发展——华为开源管理中心王晔晖

开源雨林

开源治理 OSPO OSS Compass CHAOSS

Wallys/DR7915/MT7915/MT7975/industrial mini pcie card /support openwrt

Cindy-wallys

MT7975 MT7915

临沂等级保护测评机构有几家?在哪里?

行云管家

等保 等级测评 临沂

打造视觉智能引擎,AI识货赋能商品数字化 | StartDT AI Lab _AI&大模型_阿北@奇点云_InfoQ精选文章