写点什么

优酷大剧全链路技术保障探索和实践

  • 2020-02-19
  • 本文字数:2081 字

    阅读完需:约 7 分钟

优酷大剧全链路技术保障探索和实践

优酷大剧全链路技术保障探索和实践

一、什么是大剧保障?

优酷大剧保障主要是对大剧、大综等节目视频上线前和上线后进行质量保障。大剧视频上线所涉及方很多:比如播放(类似报错、卡住、黑屏、声音等问题)、付费权益、运营配置、用户舆情反馈是否正常等。


总的来说,优酷大剧保障主要是在大剧大综开播前、开播后对视频进行质量保障,及时发现问题并解决,避免资损和客诉,使用户有更好的观影体验。

二、 如何保障?

大剧保障基本涵盖了大剧生命周期的全链路各个阶段保障,其中核心环节包括以下方面:



针对图中的各阶段,我们建设了大剧上线流程中需要保障的环节以及能力:


  1. 视频生产

  2. 视频生产环节保障包括片源质量、上传转码质量等维度,主要以视频质量检测为主。

  3. 1) 介质到位时间,在上线前 24 小时检查介质是否到位。

  4. 2) 介质质量,采用机检和人工检查两种方式进行,保证片源正常。

  5. 3) 上传转码耗时评估,重点关注开播前转码完成情况。

  6. 4) 转码完成的流会自动进入视频质量检测,检测其声音、画质、数据等。

  7. 5) 直播流生产场景,主要检测源流规格、流稳定性等源流质量,录制过程中关注负载、排队、耗时、画质等。

  8. 运营管理

  9. 1) 视频、节目播控策略检测及实时监控。

  10. 2) 媒资数据检查,如广告点位、编目、其他重要字段,实时变化通知。

  11. 权益管理

  12. 付费会员是视频网站的重要上帝用户,保证会员权益重中之重:

  13. 1) 会员可看视频的会员权益正确。

  14. 2) 付费点播的交易、权益正确。

  15. 3) 视频相关付费属性的校验和实时监控。

  16. 播放环节

  17. 播放环节是最主要的环节。以前有个痛点:视频在开播前是屏蔽状态,无法提前通过前端播放,只能等开播后到线上观看,如果有问题则为时已晚。为了解决这个问题,我们建设了播放预览能力:

  18. 1) 播放提供预览环境,可以播放未上线的视频,同时与线上真实场景保持一致的会员权益、广告、播放策略等,保证上线前可以模拟上线后的真实数据。

  19. 2) 同时优酷提供 APP、PC 等客户端预览环境,得以在各端验证播放效果。

  20. 另外,我们也将播放自动化测试能力赋能在播放环节,比如接口自动化测试、播放器自动化测试。

  21. 线上监控

  22. 1) 上线之后,除了有全量的播放监控,也有针对大剧建立了相应指标监控和报警,如播放成功率、卡顿率等。

  23. 2) 对弹幕评论、客诉反馈、社会舆情中的信息,建立了实时监控,发现问题及时响应排查。

三、大剧保障平台

围绕以上各环节,我们建立了大剧保障平台,提供自动或人工的检测机制,并有相关变更和事件的通知触达能力。


下图是我们覆盖到的业务以及相关的功能。



  1. 大剧管理

  2. 我们会将重要级别的剧集自动或手动方式录入到大剧保障平台,平台将自动拉取节目下的正片视频、介质,上线时间等信息,大剧保障将围绕上线时间展开一系列的保障。


  3. 服务管控

  4. 大剧上线期间,相关信息第一时间同步给各环节服务方,核心应用避免在大剧上线期间发布,如有服务发布或变更出现问题,第一时间回滚,避免问题扩大化。为了避免大剧上线期间因服务发布产生的问题,我们制定了服务管控规则:

  5. 1) 大剧上线期间禁止相关业务发布变更,会在开播前机器人通知所有人。

  6. 2) 热度比较高的剧,实施封网管控。

  7. 问题触达

  8. 建立大剧保障钉钉群,将所有相关业务方技术、产品、运营等同学集中到一起,并配置机器人用于发送报警通知。系统支持订阅大剧重要字段的变更通知,实时监听正片的各个字段变化,有异常则报警通知。同时将各个业务方已有的保障和报警能力接入进来。

  9. 检测预警消息接入后,各环节消息非常多,重要消息有可能会被忽略,那如何优化消息触达,不错过重要异常信息呢?通过持续建立和优化机器判断的能力,重要异常情况发送报警并精准触达到指定人。同时我们会存储以上所有操作变更记录和时间点,用于快速排查问题。

  10. 机器和人工保障

  11. 1) 系统自动执行各个环节的机器检测,并提供人工 check 机制,双重保障。


  12. 2) 上线前实时的检测以及结果直观的展示。


  13. 3) 上线前 24 小时播报检测情况,比如在上线前的 12 小时、4 小时、1 小时播报当前检测状态。这样不仅让各方知晓即将上线剧集,也了解各个业务的检查状况。

  14. 线上监控

  15. 1) 上线后的实时弹幕评论预警,客诉预警。其中我们在弹幕评论这块做到了自动化过滤关键字来实时报警,这也是比较准确和及时的舆情来源。

  16. 2) 上线后的播放质量监控。监控各端播放卡顿、成功率、错误数等情况,及时关注各端播放情况。

  17. 应急预案

  18. 大剧建设了发现问题的能力,也要有应对快速止血的机制。我们确定了出现问题时的预案项以及相关人员,保证问题第一时间准确的传达和快速止血,保证及时止损和问题快速修复,减少对用户的影响。

四、总结

通过以上大剧保障能力的建设,我们在一个平台上可以直观的看到每部大剧在上线前各个环节的健康状态,异常变动有预警通知,有线上的稳定性监控以及舆情监控,线上问题有相对应的快速止血策略,整个保障链路形成闭环。目前平台相关能力仍在持续建设中,横向我们将覆盖更多的相关联业务方,纵向将持续细化和加强每个业务方的保障能力。我们的目标是向着自动化、智能化发展,无人值守,做到上线前“心里有底”,上线后“心里不慌”。


作者介绍


党高锋,阿里文娱高级测试开发工程师。


相关阅读


优酷播放测试体系构建及平台化整合方案


优酷如何构建覆盖全网的播放白盒测试体系


2020-02-19 14:232152

评论

发布
暂无评论
发现更多内容

分布式事务的21种武器 - 7

俞凡

架构 云原生

CMake构建指南:如何提高C/C++项目的可维护性

小万哥

Linux 程序员 C/C++ 后端开发 cmake

DR5白金版 for mac(PS一键磨皮插件Delicious Retouch)支持ps2022 v5.0汉化版

Rose

DR5白金版 PS一键磨皮插件 dr5插件 汉化版PS插件 dr5插件教程

Parallels Desktop如何退出账号?PD18虚拟机退出账号方法

Rose

pd18虚拟机 PD如何退出账号 Parallels Desktop下载 Parallels破解版 Mac虚拟机下载

爆肝了!阿里最新版的这份Spring Security源码手册,狂揽GitHub榜首

做梦都在改BUG

Java spring spring security Spring Security OAuth

阿里“妈宝级”之作,Kubernetes原理剖析与实战应用手册,太全了

做梦都在改BUG

Java Kubernetes k8s

Maven Cannot resolve plugin org.apache.maven.plugins

Andy

Office 2021和 Office 365 有什么不同之处?office 2021 和 365 区别是什么

Rose

Office 365 Office 2021 office下载

工厂+策略在springboot项目中的使用场景

做梦都在改BUG

Java Spring Boot 工厂模式 策略模式

深度学习进阶篇-预训练模型[4]:RoBERTa、SpanBERT、KBERT、ALBERT、ELECTRA算法原理模型结构应用场景区别等详解

汀丶人工智能

自然语言处理 深度学习 预训练模型 Transformer BERT

Java面试集锦

源字节1号

微信小程序 开源 软件开发 后端开发

Nautilus Chain上线主网,为DeFi和流支付的未来构建基础

西柚子

五十万字总结!2023最新Java面试八股汇总(含答案,收藏版)

采菊东篱下

Java 面试

iOS MachineLearning 系列(19)—— 分析文本中的问题答案

珲少

photoshop神经滤镜是什么,神经滤镜功能揭秘~

Rose

photoshop神经滤镜 Neural Filters插件 ps滤镜下载 PS2023破解

软件测试/测试开发丨Web自动化 PageObject 设计模式

测试人

程序员 软件测试 自动化测试 测试开发 Web自动化测试

2023-05-27:给你一个只包含小写英文字母的字符串 s 。 每一次 操作 ,你可以选择 s 中两个 相邻 的字符,并将它们交换。 请你返回将 s 变成回文串的 最少操作次数 。 注意 ,输入数据

福大大架构师每日一题

Go 算法 rust 福大大

C语言编程—数组

芯动大师

简直人生外挂,直接涨薪25K,跪谢这份Java性能调优实战宝典

做梦都在改BUG

Java 性能优化 性能调优

Nautilus Chain上线主网,为DeFi和流支付的未来构建基础

鳄鱼视界

非常全面的 SpringBoot 保姆级笔记,面面俱到,太牛了

做梦都在改BUG

Java spring 微服务 Spring Boot 框架

文心一言 VS 讯飞星火 VS chatgpt (23)-- 算法导论4.2 5题

福大大架构师每日一题

福大大 文心一言 讯飞星火

使用Go语言实现门面模式:简化复杂子系统的访问

Jack

AE模板:短信消息聊天对话气泡动画Smart Text Message

Rose

AE模板下载 Smart Text Message 对话框气泡生生成器插件

国外顶级架构师编写2580页DDD领域驱动设计笔记,看到内容后破防了

做梦都在改BUG

Java 架构 领域驱动设计 DDD

基于Redis讲解,学懂缓存雪崩,缓存击穿,缓存穿透

做梦都在改BUG

Java redis 缓存穿透 缓存击穿 缓存雪崩

Java面试很难?啃完阿里老哥这套Java架构速成笔记,我都能拿30K

做梦都在改BUG

Python潮流周刊#3:PyPI 的安全问题

Python猫

Python 编程 rust 安全

Nautilus Chain上线主网,为DeFi和流支付的未来构建基础

股市老人

耗时一周整理的牛客网上最火Java面试八股文,面试必备

架构师之道

Java 面试

优酷大剧全链路技术保障探索和实践_软件工程_阿里巴巴文娱技术_InfoQ精选文章