写点什么

算法如何促成亿级别扶持曝光视频?爱奇艺 Budget Pacing 智能扶植系统实践

  • 2021-06-15
  • 本文字数:2846 字

    阅读完需:约 9 分钟

算法如何促成亿级别扶持曝光视频?爱奇艺Budget Pacing智能扶植系统实践

视频的保量和扶植对于视频平台而言是一种重要的分发策略。不同于普通的推荐算法,出于商业、画风等角度的考量,视频扶植往往要保证指定的视频物料有一定的曝光量,并尽可能地降低对推荐系统效果的负面影响。在本文中,我们主要介绍爱奇艺自研的基于改进的 Budget Pacing 算法的智能扶植系统是如何在保证对用户消费指标影响可控的前提下,达到最大量级和最高效的扶持效果。

背景

对于爱奇艺等在线视频服务平台来说,除了普通的推荐算法之外,出于各种考量,往往要求对于指定的新热视频增加曝光。


在具体的应用场景下,爱奇艺和随刻短视频流中,超级粉丝、电商视频以及各类剧集综艺的运营物料视频等等,均需要使用扶植保量保证播放量的最大化。


图一 feed 流中的扶植保量视频


feed 流的曝光资源是有限的,内容间存在竞争,对扶植视频增加曝光必然会挤压推荐算法产出视频的曝光资源,对推荐系统产生负面影响。


另一方面扶植视频间也有差异,有的视频保量额度消耗过快,甚至在最初的几分钟内就完成保量目标,早早退出竞争,无法触达更匹配的用户,降低消费指标;而另一些视频又得不到有效分发。这就是典型的扶植保量问题。


因此我们设计了生态智能扶植系统,直接进行视频级别的扶植保量,针对不同视频的保量目标和真实的消费情况进行定制化的扶植,且所有保量视频共同竞争恒定的展示资源,降低对消费的影响。另外采用类似计算广告领域的 Budget Pacing 机制,将保量展示目标按照实际流量曲线分配在保量周期内,且根据具体消费情况动态调整保量程度,使视频在保量周期内均匀分发,完成保量目标。


另外生态智能扶植系统使用提升视频在精排中的位置的方式为视频提权,保证其扶植保量效果的确定性。


图 2:生态智能扶植系统流程结构图

问题分析

我们认为,视频的扶植保量和计算广告领域的预算控制问题有相似的地方:预算控制的核心问题是如何平稳地消费掉广告主的预算,并帮助广告主优化转化效果。而视频的扶植保量的核心问题是如何平稳的消耗掉视频的目标曝光量,并保证将对整体的消费影响尽可能降低。所以视频的扶植保量要完成以下两个目标:


(1)匀速分发

通过视频目标曝光量、当前曝光量和曝光曲线来控制视频的投放速度;


(2)提升视频消费指标

保证扶植视频对整体消费影响尽可能低。


计算广告的预算控制方案目前分为两大类:Probabilistic throttling 和 Bid modification,Probabilistic throttling 通过一个概率控制广告参与竞价的频率从而达到控制预算消费速度的目的,而 Bid modification 则通过修改竞价的方式来控制预算消费速度。

图 4(a):Probabilistic throttling

图 4(b):Bid modification


对于视频扶植保量场景而言,视频的目标曝光量即为“预算”,因此每次曝光的“竞价”是恒定的数值,即为曝光次数,不能通过 Bid modification 来修改“竞价”,因此我们采用 Probabilistic throttling 作为基础框架设计智能扶植系统。

框架设计

扶植保量系统首先要保证扶植保量视频的分发趋势和大盘整体曝光趋势保持一致。我们以 5 分钟为单位,将一天拆分为 288 个时间片,根据历史数据统计出一天内大盘整体曝光趋势。


图 4(a):时间片-流量曲线


图片 4(b):时间片-流量累计曲线


值得注意的是,在原始的计算广告的 Probabilistic throttling 方案中,广告物料享有单独的展示资源,因此广告物料之间只需通过概率进行竞争,胜者则可以占有专门为广告预留的展示位。


但在视频扶植保量的场景中,不仅有扶植保量视频之间竞争保量机会,扶植保量视频也会和普通视频竞争,因此除了要使用概率之外,我们又引入了精排位置提权机制,对于需要扶植保量的视频,根据目标曝光量,直接提升视频在精排中的排序位置,使得扶植保量视频在与普通视频的竞争中更占优势,从而达到扩大曝光的目的。


因此我们需要根据历史数据统计出精排中排序位置和曝光量的关系曲线。这里需要注意的是,由于不同时间片的曝光效能不同(如晚高峰的曝光效能大于凌晨),所以每一个时间片都有一个独立的位置-曝光曲线。


图 5:位置-曝光曲线


则有具体算法如下:


对任意扶植保量视频  ,记其全天预期保量曝光为  ,将一天拆分为时间片集合  ,对于时间片  ,  表示截止时间片  结束时的累积预期曝光,则根据图四(b)中描述的累计曝光曲线,可将  拆分为各个时间片的累计曝光集合  ,其中  。同时对于时间片  ,亦有  表示截止时间片  结束时的累积真实曝光


对下一个即将来到的时间片  ,该时间片内的预期曝光  ,根据图五可得满足  曝光要求的最大的位置。同样的,我们也可求得上一个刚结束的时间片  ,该时间片内的真实曝光  ,根据图五亦可得对应  曝光的最大的位置,设为对于时间片  ,扶植保量视频达到其预期曝光所需要的达到的精排位置的均值,而对于时间片  ,扶植保量视频实际达到的精排位置的均值,因此在时间片,我们需要 在每一次精排结果中提升的位置。


其中,保证 σ 表示对超量分发的视频不进行降权。


此外,由于图五中精排位置与曝光量的对应关系是离散的,  所对应的曝光量(设为  )一般情况下会大于  的要求,因此为了防止扶植保量的超发,约定扶植保量视频  在时间片  参与竞争的概率为:

 

最后推荐引擎便可在任意时间片  对任意视频  ,根据 σ 和  进行精排位置调整,从而达到扶植保量的效果。

线上效果

日均扶持量:生态智能扶植系统单日扶持曝光达到亿级别。


曝光完成率:旧版保量曝光完成率(实际曝光/曝光目标>80%)低于 5%,生态智能扶植系统保量完成度大幅提升,随刻端达到 65-70%,基线端达到 50-60%,保量完成率提升 20 倍左右。


对系统影响:实现扶持保量视频分发智能控速,将对系统的人均播放时长影响从 3.5%降低到 2.5%,人均展示视频数的影响从 2%降低到 0.15%。


运营业务成果:助力《奇葩说》等项目以及百科、开箱等垂类优质内容分发。保证了对优质视频和优质创作者的曝光,对提高优质作者的平台粘性有重大意义。

总结与展望

以上是我们近期在生态扶植保量领域的一些工作,实践证明基于 Budget Pacing 的生态智能扶植系统确实能够对视频的扶植保量任务产生很大的助益。后续我们还会从以下几个角度进行优化:


(1)秩序优化扶植系统和相关扶植召回,保证扶植完成度的基础上进一步降低对整体消费的影响;

(2)当前的扶植系统类似于计算广告的竞价消费方式,无法保证视频的目标曝光量一定完成,考虑增加担保式保量投放机制,保证视频曝光的数量。


参考文献:

1. Agarwal D, Ghosh S, Wei K, et al. Budget pacing for targeted online advertisements at linkedin[C]//Proceedings of the 20th ACM SIGKDD international conference on Knowledge discovery and data mining. 2014: 1613-1619.

2.Xu J, Lee K, Li W, et al. Smart pacing for effective online ad campaign optimization[C]//Proceedings of the 21th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining. 2015: 2217-2226.


本文转载自:爱奇艺技术产品团队(ID:iQIYI-TP)

原文链接:算法如何促成亿级别扶持曝光视频?爱奇艺Budget Pacing智能扶植系统实践

2021-06-15 13:001908

评论

发布
暂无评论
发现更多内容

移动平台助力推进智慧型科研院所信息化建设

WorkPlus

基础到高级涵盖11个技术,Alibaba最新出品711页Java面试神册真香

JAVA活菩萨

Java 程序员面试 大厂技能 秋招 大厂面经

浅谈运用低代码技术如何实现物流企业的降本增效

王平

如何模拟后台API调用场景,很细!

Liam

前后端分离 开发 Postman API 前后端协作

iOS逆向之某茅台App抓包

小陈

iOS逆向 i茅台

学python,怎么能不学习scrapy呢!

华为云开发者联盟

Python 爬虫 开发 代码

重新审视分布式系统:永远不会有完美的一致性方案……

JAVA活菩萨

Java 程序员 java程序员 java 编程

力拓信创生态,博睿数据多款产品获得东方通与达梦数据库产品兼容互认证明

博睿数据

可观测性 智能运维 博睿数据 东方通 达梦数据

安装失败怎么办

和牛

测试

硬核!阿里P7技术员身经百战总结出这份210页的Java突击面试指南

了不起的程序猿

阿里巴巴 算法 高并发 Java 面试 java程序员

开发一套高容错分布式系统

JAVA活菩萨

Java 程序员 后端 java程序员 java编程

字节二面被问到mysql事务与锁问题,我蚌埠住了

程序员小毕

Java MySQL 数据库 程序员 面试

开源一夏 | 文件和目录操作|多进程和多线程【python进阶篇】

恒山其若陋兮

开源 8月月更

6000字深度总结!极狐GitLab 首次揭秘内部 DevOps 最佳实践

极狐GitLab

git DevOps gitlab 安全 CI/CD

精品!阿里P7爆款《K8s+Jenkins》技术笔记,高质量干货必收藏!

冉然学Java

jenkins java; 技术笔记 编程‘’ #k8s

荣耀发布开发者服务平台,智慧生态合作提速

荣耀开发者服务平台

华为应用市场“图章链接”功能上线 让APP分发突破机型壁垒

Geek_2d6073

【iOS逆向】某车之家sign签名分析

小陈

iOS逆向

《机器学习的随机矩阵方法》

计算机与AI

Python 机器学习 数学

RabbitMQ(五)死信队列

JAVA活菩萨

Java 程序员 后端 java程序员 java编程

全新出品!Github总榜排行第七的SpringCloud生态全栈笔记我粉了

JAVA活菩萨

Java 程序员面试 大厂技能 秋招 大厂面经

容器化 | 在 NFS 备份恢复 RadonDB MySQL 集群数据

RadonDB

MySQL 数据库 容器化 Kubernetes 集群 备份 & 恢复

阿里大牛最新分享springboot实战派文档,开发之路必不可少

Java工程师

Java spring springboot

博云入选Gartner中国云原生领域代表性厂商

BoCloud博云

云计算 容器 云原生 Gartner

【Android逆向】rpc调用某安App的X-App-Token签名函数

小陈

逆向技术

Python 教程之输入输出(4)—— 用于竞争性编程的 Python 输入法

海拥(haiyong.site)

Python 8月月更

从云计算到函数计算

阿里巴巴云原生

阿里云 Serverless 云原生 函数计算

《机器学习理论到应用》电子书免费下载

计算机与AI

Python 机器学习 数据科学

iOS逆向之某多多App抓包

小陈

拼多多 iOS逆向

阿里出品Spring Security王者晋级笔记,并附上源码解析

冉然学Java

编程 spring security java; Spring Boot CLI 源码、

小程序+自定义插件的混合模式

Geek_99967b

小程序

算法如何促成亿级别扶持曝光视频?爱奇艺Budget Pacing智能扶植系统实践_AI&大模型_爱奇艺技术产品团队_InfoQ精选文章