写点什么

让机器读懂视频:亿级淘宝视频背后的多模态 AI 算法揭秘(一)

  • 2020-01-09
  • 本文字数:1163 字

    阅读完需:约 4 分钟

让机器读懂视频:亿级淘宝视频背后的多模态AI算法揭秘(一)


本文内容大纲:

1、多模态在视频分类算法中的应用探索

2、视频分类算法中的层次化分类器的设计

3、总结和展望

背景

随着 4G 的普及和 5G 的推出,内容消费的诉求越来越受到人们的重视。2019 年互联网趋势报告指出在移动互联网行业整体增速放缓的大背景下,短视频行业异军突起,成为“行业黑洞”抢夺用户时间,尽管移动互联网人口红利见顶,新的增长点难以寻觅,但中国短视频人均使用时长及头部短视频平台日均活跃用户均持续增常(如图 1 所示)。



图一


在淘宝,短视频业务一直以来都是非常重要的业务,是淘宝 app 从单一的商品导购 app 走向商品导购+内容消费的多元化 app 的关键所在。相较于单一的商品导购,商品导购+内容消费的模式有效增加用户粘性,提高用户的停留时长,最终获得 GMV 的持续增长。不仅如此,2019 年视频营销发展趋势白皮书指出目前视频内容的转发量已达到图文的 12 倍,视频营销已经成为品牌最爱的营销方式,使用视频营销比不使用视频营销收入增长速度快 49%,且从搜索获得的网站流量多 41%。现如今淘宝每年新增内容数达数十亿,其中视频数占比持续提升,预计到 2022 年视频的占比会超过 50%。如何对规模如此庞大的视频进行内容化理解,高效赋能视频运营和个性化分发变得极为关键。

视频类目体系

视频内容化理解的首要问题是构建一个完备的、层次化的类目体系,相比于传统的淘宝商品类目体系,视频类目体系需要解决两大问题。


  • 一是提高运营的精细化能力,提供内容的盘货和定向生产、以及快速搭建会场的能力;

  • 二是针对新生产的视频提供冷启动能力,提升分发的效率。


虽然淘宝的商品类目体系可以部分代替视频类目体系的功能,但会导致短视频业务的用户心智和商品导购业务同质化,因此构建一套属于短视频业务自己的视频类目体系已经迫在眉睫。有了构建完成的视频类目体系,另外一个更重要的问题是产出高效的视频分类算法,用于对海量的视频进行标签生成。为了获得好的点击效果,视频生产者往往会采用吸引眼球的封面图或者标题,但是和视频本身的内容关联性很弱。此外,淘宝的视频天然和商品有强关联性,如何利用好商品的信息也非常关键。


不同于抖音美拍等其他视频的内容体系从新闻、科技、金融等领域做分类划分,淘宝的视频类目体系从商品导购、产品功能展示、商品知识获取等角度出发,由行业经验丰富的运营进行设计,包含了 30+一级类目和 150+二级类目,其中一级类目是对视频的领域的划分,例如服饰/家居日用/美食/萌宠等,二级类目是在一级类目的基础之上对视频的子领域的划分,例如一级类目服饰下的熟女穿搭/少女穿搭/儿童服饰/中老年穿搭等,图 2 是视频类目体系的几个案例。在这个体系之上多媒体算法团队投入近半年的时间提出了基于模态注意力机制的多模态分层视频分类算法。



图二


本文转载自淘系技术公众号。


原文链接:https://mp.weixin.qq.com/s/kT01tMRPUCx307m0cF5x0w


2020-01-09 18:13721

评论

发布
暂无评论
发现更多内容

Hadoop RPC简介

数新网络官方账号

大数据 hadoop hadoop rpc

企业通关必备,iPaaS应该这样搭建

RestCloud

应用集成 ipaas 应用与数据集成

代币开发工具:从 Truffle 到 Hardhat

区块链软件开发推广运营

交易所开发 dapp开发 区块链开发 链游开发 NFT开发

Downie 4 for Mac(视频下载软件) 4.6.33和谐直装版

mac

视频下载工具 Downie4 苹果mac Windows软件

Java模块化应用实践之精简JRE | 京东云技术团队

京东科技开发者

Java jre 企业号10月PK榜 Java21

后期云端制作:激发影视行业创新力的新时代

Finovy Cloud

影视制作 云渲染 后期制作

第18期 | GPTSecurity周报

云起无垠

全球业务 | 用友废钢智能判级系统在日本成功通过验收

用友BIP

废钢智能判级

百度AICA首席AI架构师培养计划第七期毕业,大模型深入产业见成果

飞桨PaddlePaddle

架构师 大模型 AICA

如何为模型添加光照效果?

3D建模设计

材质 纹理 光照贴图

面向Three.js开发者的3D自动纹理化开发包

3D建模设计

AI 3D模型 three.js AI自动纹理

专业好用的多媒体播放器Infuse 最新版中文

胖墩儿不胖y

Mac软件 多媒体播放器

可视化(Visual) SQL初探

数新网络官方账号

数据库 sql #数据库

如何选择安全又可靠的文件数据同步软件?

镭速

数据实时同步

中企出海 | 中建材、红狮、华润、华新都在做的事儿!

用友BIP

中企出海

数字化转型如何落地?

优秀

数字化转型 数字化业务转型

苹果mac电脑矢量插画设计推荐 Illustrator 2024 补丁激活版中文

mac大玩家j

Mac软件 矢量设计 Mac软件矢量工具

去中心化应用程序(DAPPS)开发

西安链酷科技

分布式 dapp 去中心化 交易所

EVE-NG的环境导入IOL组件

小魏写代码

写出一个复杂的SQL步骤

程序员万金游

#数据库 #java #Mysql #SQL

用友BIP,IoT在光伏行业的应用

用友BIP

物联网 智能制造

40 + 专家齐聚共谋数据未来,StarRocks Summit 2023 议程公布!更多精彩议题等你探索...

StarRocks

数据库 OLAP StarRocks

涛思数据与胜软科技达成战略合作,共同赋能石油行业数字化转型

TDengine

tdengine 时序数据库

浅析Redis大Key | 京东云技术团队

京东科技开发者

redis key redis 底层原理 企业号10月PK榜

多链多签名数字货币加密货币

西安链酷科技

区块链 软件开发 dapp 去中心化 钱包

企业内部外网向内网传输文件如何实现高效安全?

镭速

内外网数据交换 内部外网隔离

独家特性 | 腾讯云大数据ES:一站式索引全托管,自治索引大揭秘!

腾讯云大数据

多模态对比语言图像预训练CLIP:打破语言与视觉的界限

汀丶人工智能

人工智能 自然语言处理 计算机视觉 GPT 多模态大模型

mybatis plus很好,但是我被它坑了!

越长大越悲伤

Java MySQL mybatis Mybatis Plus

3D模型如何添加金属贴图?

3D建模设计

材质 纹理 金属贴图

QCN9024 with IPQ4019|Wallys Dual Band Card DR9074E: Unleash the Power of Open Source Networking

wallyslilly

IPQ4019 QCN9074

让机器读懂视频:亿级淘宝视频背后的多模态AI算法揭秘(一)_语言 & 开发_淘系技术_InfoQ精选文章