QCon 演讲火热征集中,快来分享技术实践与洞见! 了解详情
写点什么

算法如何促成亿级别扶持曝光视频?爱奇艺 Budget Pacing 智能扶植系统实践

  • 2021-06-15
  • 本文字数:2846 字

    阅读完需:约 9 分钟

算法如何促成亿级别扶持曝光视频?爱奇艺Budget Pacing智能扶植系统实践

视频的保量和扶植对于视频平台而言是一种重要的分发策略。不同于普通的推荐算法,出于商业、画风等角度的考量,视频扶植往往要保证指定的视频物料有一定的曝光量,并尽可能地降低对推荐系统效果的负面影响。在本文中,我们主要介绍爱奇艺自研的基于改进的 Budget Pacing 算法的智能扶植系统是如何在保证对用户消费指标影响可控的前提下,达到最大量级和最高效的扶持效果。

背景

对于爱奇艺等在线视频服务平台来说,除了普通的推荐算法之外,出于各种考量,往往要求对于指定的新热视频增加曝光。


在具体的应用场景下,爱奇艺和随刻短视频流中,超级粉丝、电商视频以及各类剧集综艺的运营物料视频等等,均需要使用扶植保量保证播放量的最大化。


图一 feed 流中的扶植保量视频


feed 流的曝光资源是有限的,内容间存在竞争,对扶植视频增加曝光必然会挤压推荐算法产出视频的曝光资源,对推荐系统产生负面影响。


另一方面扶植视频间也有差异,有的视频保量额度消耗过快,甚至在最初的几分钟内就完成保量目标,早早退出竞争,无法触达更匹配的用户,降低消费指标;而另一些视频又得不到有效分发。这就是典型的扶植保量问题。


因此我们设计了生态智能扶植系统,直接进行视频级别的扶植保量,针对不同视频的保量目标和真实的消费情况进行定制化的扶植,且所有保量视频共同竞争恒定的展示资源,降低对消费的影响。另外采用类似计算广告领域的 Budget Pacing 机制,将保量展示目标按照实际流量曲线分配在保量周期内,且根据具体消费情况动态调整保量程度,使视频在保量周期内均匀分发,完成保量目标。


另外生态智能扶植系统使用提升视频在精排中的位置的方式为视频提权,保证其扶植保量效果的确定性。


图 2:生态智能扶植系统流程结构图

问题分析

我们认为,视频的扶植保量和计算广告领域的预算控制问题有相似的地方:预算控制的核心问题是如何平稳地消费掉广告主的预算,并帮助广告主优化转化效果。而视频的扶植保量的核心问题是如何平稳的消耗掉视频的目标曝光量,并保证将对整体的消费影响尽可能降低。所以视频的扶植保量要完成以下两个目标:


(1)匀速分发

通过视频目标曝光量、当前曝光量和曝光曲线来控制视频的投放速度;


(2)提升视频消费指标

保证扶植视频对整体消费影响尽可能低。


计算广告的预算控制方案目前分为两大类:Probabilistic throttling 和 Bid modification,Probabilistic throttling 通过一个概率控制广告参与竞价的频率从而达到控制预算消费速度的目的,而 Bid modification 则通过修改竞价的方式来控制预算消费速度。

图 4(a):Probabilistic throttling

图 4(b):Bid modification


对于视频扶植保量场景而言,视频的目标曝光量即为“预算”,因此每次曝光的“竞价”是恒定的数值,即为曝光次数,不能通过 Bid modification 来修改“竞价”,因此我们采用 Probabilistic throttling 作为基础框架设计智能扶植系统。

框架设计

扶植保量系统首先要保证扶植保量视频的分发趋势和大盘整体曝光趋势保持一致。我们以 5 分钟为单位,将一天拆分为 288 个时间片,根据历史数据统计出一天内大盘整体曝光趋势。


图 4(a):时间片-流量曲线


图片 4(b):时间片-流量累计曲线


值得注意的是,在原始的计算广告的 Probabilistic throttling 方案中,广告物料享有单独的展示资源,因此广告物料之间只需通过概率进行竞争,胜者则可以占有专门为广告预留的展示位。


但在视频扶植保量的场景中,不仅有扶植保量视频之间竞争保量机会,扶植保量视频也会和普通视频竞争,因此除了要使用概率之外,我们又引入了精排位置提权机制,对于需要扶植保量的视频,根据目标曝光量,直接提升视频在精排中的排序位置,使得扶植保量视频在与普通视频的竞争中更占优势,从而达到扩大曝光的目的。


因此我们需要根据历史数据统计出精排中排序位置和曝光量的关系曲线。这里需要注意的是,由于不同时间片的曝光效能不同(如晚高峰的曝光效能大于凌晨),所以每一个时间片都有一个独立的位置-曝光曲线。


图 5:位置-曝光曲线


则有具体算法如下:


对任意扶植保量视频  ,记其全天预期保量曝光为  ,将一天拆分为时间片集合  ,对于时间片  ,  表示截止时间片  结束时的累积预期曝光,则根据图四(b)中描述的累计曝光曲线,可将  拆分为各个时间片的累计曝光集合  ,其中  。同时对于时间片  ,亦有  表示截止时间片  结束时的累积真实曝光


对下一个即将来到的时间片  ,该时间片内的预期曝光  ,根据图五可得满足  曝光要求的最大的位置。同样的,我们也可求得上一个刚结束的时间片  ,该时间片内的真实曝光  ,根据图五亦可得对应  曝光的最大的位置,设为对于时间片  ,扶植保量视频达到其预期曝光所需要的达到的精排位置的均值,而对于时间片  ,扶植保量视频实际达到的精排位置的均值,因此在时间片,我们需要 在每一次精排结果中提升的位置。


其中,保证 σ 表示对超量分发的视频不进行降权。


此外,由于图五中精排位置与曝光量的对应关系是离散的,  所对应的曝光量(设为  )一般情况下会大于  的要求,因此为了防止扶植保量的超发,约定扶植保量视频  在时间片  参与竞争的概率为:

 

最后推荐引擎便可在任意时间片  对任意视频  ,根据 σ 和  进行精排位置调整,从而达到扶植保量的效果。

线上效果

日均扶持量:生态智能扶植系统单日扶持曝光达到亿级别。


曝光完成率:旧版保量曝光完成率(实际曝光/曝光目标>80%)低于 5%,生态智能扶植系统保量完成度大幅提升,随刻端达到 65-70%,基线端达到 50-60%,保量完成率提升 20 倍左右。


对系统影响:实现扶持保量视频分发智能控速,将对系统的人均播放时长影响从 3.5%降低到 2.5%,人均展示视频数的影响从 2%降低到 0.15%。


运营业务成果:助力《奇葩说》等项目以及百科、开箱等垂类优质内容分发。保证了对优质视频和优质创作者的曝光,对提高优质作者的平台粘性有重大意义。

总结与展望

以上是我们近期在生态扶植保量领域的一些工作,实践证明基于 Budget Pacing 的生态智能扶植系统确实能够对视频的扶植保量任务产生很大的助益。后续我们还会从以下几个角度进行优化:


(1)秩序优化扶植系统和相关扶植召回,保证扶植完成度的基础上进一步降低对整体消费的影响;

(2)当前的扶植系统类似于计算广告的竞价消费方式,无法保证视频的目标曝光量一定完成,考虑增加担保式保量投放机制,保证视频曝光的数量。


参考文献:

1. Agarwal D, Ghosh S, Wei K, et al. Budget pacing for targeted online advertisements at linkedin[C]//Proceedings of the 20th ACM SIGKDD international conference on Knowledge discovery and data mining. 2014: 1613-1619.

2.Xu J, Lee K, Li W, et al. Smart pacing for effective online ad campaign optimization[C]//Proceedings of the 21th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining. 2015: 2217-2226.


本文转载自:爱奇艺技术产品团队(ID:iQIYI-TP)

原文链接:算法如何促成亿级别扶持曝光视频?爱奇艺Budget Pacing智能扶植系统实践

2021-06-15 13:001942

评论

发布
暂无评论
发现更多内容

你敢信?清华毕业大佬用了一个坦克大战项目就讲完了23种设计模式

程序员高级码农

Java 编程 程序员 java面试 Java面试题

基于豆包·视频生成模型打造创新体验,即梦成为“想象力的相机”

Geek_2d6073

责任链模式

EquatorCoco

Java 责任链

一文彻底弄懂MySQL的各个存储引擎,InnoDB、MyISAM、Memory、CSV、Archive、Merge、Federated、NDB

快乐非自愿限量之名

MySQL 数据库

原生稳定|如何构建 Auto Table Service 保证高性能查询

AI数据云Relyt

数据库 大数据 数据仓库 数据湖

天谋科技时序数据库 IoTDB 入选工信部中国电子信息行业联合会优秀创新软件产品推广目录

Apache IoTDB

【杂谈】服务端能同时处理多少个 Socket 连接?背后的资源与限制分析

不在线第一只蜗牛

网络 服务器

苦熬3个月,阿里Java岗五面,成功上岸获offer!Java面试题库分享

程序员高级码农

Java 程序员 后端 java面试 Java面试题

《Django 5 By Example》读后感

codists

Python django

火山引擎云基础、模型服务等多产品更新发布,为企业大模型应用落地再提效

Geek_2d6073

鸿蒙 NEXT 开发之后台任务开发服务框架学习笔记

威哥爱编程

HarmonyOS HarmonyOS框架 HarmonyOS NEXT HarmonyOS5.0

DNS DDoS攻击威胁加剧,国科云解析筑牢网络安全防线

国科云

极致性价比|从存算分离到Serverless,数仓要解决的关键问题

AI数据云Relyt

大数据 Serverless 数据仓库 数据湖 存算分离架构

为什么技术高管汇报一定要用数据说话?

思码逸研发效能

程序员 研发效能 IT管理 研发效能度量 管理技术团队

提升海外SaaS访问效率的最佳方案

Ogcloud

网络加速 SD-WAN SD-WAN组网 海外网络加速 SD-WAN国际专线

KaiwuDB 智能综采应用项目获中国信通院数据库星河“典型案例”

KaiwuDB

数据库

从体系建设到深化应用,中国管理会计实现十年跃迁(上)

用友智能财务

喜讯!云起无垠荣膺信通院 2023 - 2024 年度 “铸链” 案例自主研发创新成果奖

云起无垠

【YashanDB知识库】insert语句有编码不识别字,执行卡住问题

YashanDB

数据库

1219| 清华AI助攻科研升职 | Anthropic揭示模型风险 | Genesis开源物理引擎 | 字节新视觉理解模型 | OpenAI功能革新 | 武汉大学成立AI学院 | 上海报业数字人上线

言寡意多

Java内卷加剧,死磕八股还有用吗?

了不起的程序猿

spring 程序员 后端 架构师 java面试

一个Java程序员具备什么样的素质和能力才可以称得上高级工程师?

了不起的程序猿

程序员 性能优化 后端 架构师 java面试

苹果M4芯片玩游戏怎么样?全新MacBook Pro 适合打游戏吗?

阿拉灯神丁

crossover pd虚拟机 MacBook Pro 苹果mac游戏 macOS 14 Sonoma

Java程序员如何高效学习Spring Security?

了不起的程序猿

程序员 后端 架构师 springsecurity java面试

解锁未来:深入探索去中心化应用程序(DApps)的潜力与挑战

chainwiseweb3

去中心化钱包 区块链技术开发 dapp开发 #Web3 DApps开发

大规模数据分析提效|行列混存格式下的读链路优化

AI数据云Relyt

数据仓库 AI-ready 数据云

实力认可|质变科技获2024爱分析·数据智能优秀厂商奖项

AI数据云Relyt

数据分析 数据智能 AI-ready Data Cloud 质变科技 爱分析

SD-WAN加速海外SaaS访问速度

Ogcloud

网络加速 SD-WAN SD-WAN组网 SDWAN SD-WAN国际专线

几张图带你了解.NET 8中的 String

快乐非自愿限量之名

.net

一触“伙伴+华为”体系,传媒行业点亮数智之光

脑极体

AI 传媒

【YashanDB知识库】IMP跨网络导入慢问题

YashanDB

数据库 yashandb

算法如何促成亿级别扶持曝光视频?爱奇艺Budget Pacing智能扶植系统实践_AI&大模型_爱奇艺技术产品团队_InfoQ精选文章