写点什么

美图海量短视频内容分析与检索(二)

  • 2019-11-30
  • 本文字数:977 字

    阅读完需:约 3 分钟

美图海量短视频内容分析与检索(二)

如何有效定义标签体系

我们有一个热门视频池,运营和产品会手动为一些视频打上标签。你可能会说,我们可以拿这部分标签做模型训练。如果我们将业务标签应用于算法会存在哪些问题呢?


一是业务的标签比较抽象,比如可能会制定像搞笑和幽默这样的一些标签。但一个视频是否算搞笑、幽默,无法仅从视觉或声音、语音等一些信息进行准确判定。


举个例子,一个 3 岁的小孩在哭,父母上传的可能会是一个搞笑的视频,如果是 20 多岁或者 50 多岁的人在哭,那就是一个悲伤的视频。


二是训练数据不均衡,上图是我们拿到的一部分业务标签对应的数据量,因为业务人员在定标签的时候不会考虑每个类别是什么样的,所以就会出现训练数据不均衡的问题,这个也会影响算法模型的训练。


另一个问题是类别区分度低。以上图为例,手指舞和自拍,从视觉角度来看没有任何区别,如果训练中强行将其分成两类,也会在训练过程中影响网络模型的学习,会引起一些噪声。


还有一个问题是标签的维度比较单一。通常一个视频,最多给四到五个维度的标签,再多的话,想全面衡量这个视频会变得非常复杂。


我们的解决方法是,以业务标签作为指引,拿我们的视频数据和文本数据(伴随视频的标题、评论相关信息)去提取视频特征、音频特征进行聚类,然后对聚类进行抽象定义,得出相应的视觉标签元素。这个标签元素就是我们用来训练的标签。最后训练标签输出的结果会反过来映射到业务标签,用这种方法定义的标签是多层级多维度的。


如下图所示,视频中是一个女生,视频中的姿态显示为全身,动作是在摇摆,检测到的音乐风格为摇滚,那么可以判断这个视频是一个美女在自拍,而且在跳舞,属于才艺展示,于是生成的标签就是“美女自拍”、“舞蹈”、“才艺”。这就完成一个算法标签到业务标签的映射。

如何提高线上算法模型的迭代更新效率

这里有三个核心问题:快速的数据标注、有效稳定的模型评估机制、算法运行的性能要有保障。


为了进行快速标注,我们也用了一个自动的算法标注,这个算法在无监督和半监督的深度学习的论文中被提到过。我们会预先拿一个通用的数据训练模型,对业务数据进行少量的标注,基于少量的标注数据再训练一个分类器。这个分类器会给其它未标注的进行标注。伴随标签输出会有一些置信度,会把高置信度的数据再拿去进行训练,低置信度的会继续下一次的迭代更新,这个过程会重复多次。这个过程也会根据任务的难度,加入人工的核验和标注。


2019-11-30 22:53986

评论

发布
暂无评论
发现更多内容

架构师训练营大作业

方堃

使用枚举的正确姿势

Java旅途

Java 单例 枚举

架構師訓練營第1期-第01周總結

Panda

iOS面试梳理 - 2020年8月初

iOSer

ios 面试

极客大学架构师训练营 0 期 结课作业

chun1123

架构师 架构师技能

食堂就餐系统 UML 图

睁眼看世界

极客大学架构师训练营 食堂就餐系统

10大高性能开发宝石

码界西柚

解构 Dubbo-go 的核心注册引擎 Nacos

apache/dubbo-go

dubbogo

互联网架构师能力图谱

dony.zhang

架构师 架构师技能

拖动旋转的 3D 骰子效果

Clloz

CSS transform rotate3d

食堂就餐卡系统设计

天天向上

极客大学架构师训练营

【性能优化】小伙伴问我性能指标监控怎么做,这次我安排上了!!

冰河

tomcat 性能优化 监控 性能调优 jvm调优

超详细超级细B站视频爬取

海绵宝宝re儿

python 爬虫 多进程

为什么我选择清晨阅读和学习

胡迪伦

学习 效率 自学编程 早起 晨型人

一个敏捷教练成长必备的8项技能

华为云开发者联盟

程序员 敏捷 敏捷开发 敏捷教练 技术技能树

小码农也有大目标,最新BAT大厂Java面试总结

Java架构师迁哥

你有没有想过为什么交易和退款要拆开不同的表?

程序员小航

设计 开发 交易 拆表

Spring-技术专题-重试机制Retry机制

码界西柚

防止重复点击2.0

老菜鸟

Vue

食堂就餐卡系统设计

Gosling

极客大学架构师训练营

第一周总结

睁眼看世界

极客大学架构师训练营

“锟斤拷”的前世今生

Java旅途

Unicode 编码 ASCII 锟斤拷

开发者说:愿为你点亮“懂环境知冷暖”智能的灯

华为云开发者联盟

人工智能 物联网 NB-IoT 路灯 华为IoT平台

第一周学习心得

alpha

极客大学架构师训练营

大作业

有了数据湖探索服务,企业决策“新”中有数

华为云开发者联盟

Serverless 数据湖 数据分析 云原生 华为云

SpringCloud Gateway 身份认证

Barry的异想世界

微服务 nacos 权限系统 Gateway spring cloud alibaba

架构师训练营大作业二

qihuajun

架构师训练营大作业一

qihuajun

食堂就餐卡系统设计

发酵的死神

极客大学架构师训练营

第一周总结

黄立

架构师 架构总结

美图海量短视频内容分析与检索(二)_文化 & 方法_RTE开发者社区_InfoQ精选文章