写点什么

60 秒售出 5 万张票!电影节抢票技术揭秘

  • 2020-03-18
  • 本文字数:3072 字

    阅读完需:约 10 分钟

60 秒售出 5 万张票!电影节抢票技术揭秘

一、背景介绍

对于电影爱好者来说,每次的电影节、影展活动,都是抢票大战的开启,出票速度几乎可以用“秒空”来形容,例如上海国际电影节线上开售的记录是 60 秒售出 5 万张。


本文主要围绕售票环节,讲述阿里文娱的云智系统是如何支撑高流量并发,保障系统的稳定,不出现重卖等实现方案背后的技术。


先简单分析一下电影节的抢票业务,典型特征是在大流量抢购、高并发的场景下,让用户极快的锁定座位然后出票,特别是热门的影片,会异常的火爆。第一道压力是查询已售座位列表和锁座,需要能快速的支撑用户的锁座请求,且实时查询到已售卖的座位列表,避免发起无效的锁座请求;第二道压力是出票,如果锁座成功,但一直出票失败,会给用户带来很不好的体验。

二、架构设计思考的方向

1.让业务赢


在分层设计上,分成渠道接入层、业务层和服务层。在业务层,对外业务和管理后台功能独立,职责清晰,快速支撑业务;服务层沉淀基础服务,构成稳定的业务和基础服务。



(图 1 业务技术大图)


2.让系统稳定


在架构设计上,接入统一网关让系统安全,有限流,对库存中心和订单中心进行数据隔离,且加入多级缓存方案,让系统稳定。



(图 2 技术架构图)

三、实现方案与技术解析

1.高并发流量如何抗?


电影节的流量是非常典型的秒杀场景,瞬时流量非常高,对于系统的高性能要求就注定很高,在云智中,我们是如何抗高并发流量的?我们通过以下三点来进行阐述:热点数据隔离、流量削峰漏斗、多级缓存。


1)热点数据隔离


在热点隔离这块,云智选择的策略包括:数据隔离和业务隔离。


数据隔离:是把查询已售卖座位和已锁定座位等库存相关的热点数据,隔离出来,单独业务数据库,且使用分库分表,减少系统性能压力,提高吞吐量。


业务隔离:电影节的业务数据,独立的业务数据生成能力,圈定参与活动的业务数据,进行缓存预热,起到隔离的效果。


2)流量削峰漏斗


关键词是“分层削峰”,漏斗式的减少请求流量,在业务链路的过程中,我们会进行业务校验,层层过滤,如用户的账号安全、购买资格,影院、影厅等基础信息状态是否正常,要购买的商品信息状态是否正常、秒杀是否已经结束等,每个层次都尽可能的过滤掉非法的请求,只在最后端处理真正有效的请求,最终减少请求到数据库 DB 的写操作流量,保证系统处理真正有效的请求。


以锁座流程为例子:



(图 3 流量削峰漏斗示例图)


3)多级缓存


在分层漏斗的前提下,云智采用分布式缓存和本地缓存 LocalCache 多级缓存的方案来抵抗高并发流量,以下简要介绍一下在系统中使用的策略:


a)缓存预热。在指定参加活动的场次后,会在限定时间内停止变更,在开售前,会自动进行预热缓存,避免激增流量击穿缓存;


b)缓存失效时长控制,对基础数据实体的 VO 对象和 DO 对象采用失效时间长短的缓存控制,静态数据和 DO 实体使用长失效时长的策略:不失效或 24H;动态数据和实体 Info 使用比较短的失效时长策略:分钟级,比如幂等性 KEY 的缓存时间为 2min;


c)本地缓存 LocalCache 使用的缓存时长策略分 3 种:2s,60s,122s。优先读本地的缓存,其次读远程分布式的缓存,使得系统可以抵抗瞬间的高并发流量。


示例图如下所示:



(图 4 多级缓存示例图)


将缓存分 2 层结构:


第一层是本地缓存结构:用户、权限、基础信息等静态数据,我们优先选择本地缓存;


第二层是全量的缓存实体信息的 DO 和 VO 信息,这层采用的是 Tair 分布式缓存。


2.系统的稳定性、高可用性如何保证?


对于任何档期或者活动,系统的稳定性都是第一要素,针对电影节的活动场景,我们使用了很多设计上的稳定性模式,其中比较核心的有:多轮全链路压测、限流、降级、动态扩容、流量调度、减少单点、依赖简化等方式;除了以上几点,本节我们重点聊一聊我们在电影节过程中是如何保障备战的?


1)保障备战体系



(图 5 保障备战体系图)


a)在战前阶段


这个阶段的工作会比较多,只有做到事前充分准备,才能有更好的保障结果,主要包括以下几个部分:


(1)梳理薄弱点,包括系统架构、系统薄弱点、核心主流程,识别出来后制定应对策略;


(2)全链路压测,对系统进行全链路压测,找出系统可以承载的最大 QPS;


(3)限流配置,为系统配置安全的、符合业务需求的限流阀值;


(4)应急预案,收集各个域的可能风险点,制作应急处理方案;


(5)安全保障,主要聚焦在账号权限管控,以最小够用原则为准,防止权限滥用,安全无小事;


(6)战前演练,通过演练来检验保障体系是否完善,演练开票现场,提高团队响应和处理能力;


(7)作战手册,制定作战手册,明确作战流程和关键点节点的任务以及沟通机制。


b)在战中阶段


活动开售,我们也称为战中,整个项目组主要专注三件事情,即“监控”、“响应”和“记录”。项目组的同学都必须要保持作战状态,严格按照应用 owner 机制,负责巡检应用情况,及时同步技术数据和业务数据是否有异常。同时,在战中,我们临时组建“保障虚拟小组”,用于应对大促期间可能出现的紧急客诉等问题,及时做出决策,控制影响范围,同时也能提高整体作战能力。记录,是在战中过程中必须要记录下各应用的峰值,及时沉淀技术数据,为后续系统建设,流量评估等提供参考借鉴。


c)在战后阶段


这个阶段的主要工作是项目复盘,复盘的内容主要包括:项目结果、项目回顾、项目沉淀和改进,将项目过程中收集到的问题和故障进行详细分析,并将项目过程中沉淀出来的,关于系统稳定性保障的经验沉淀到日常,让活动保障的常态化逐步落地。


2)最佳实践


a)精准监控


通过监控,实时发现各个服务是否触发限流值,及时进行 Review,调整限流值,保证业务成功率和系统稳定。


对系统基础值班和业务量指标进行精准监控,如 load,内存,PV,UV,错误量等,避免因内存泄露或代码的 Bug 对系统产生影响,精准监控,提前感知内存泄露等问题。


b)数据大盘


通过数据大盘,实时汇总数据,展示业务数据,为系统、为业务提供更加直观的业务支持,也可以更加有效的进行业务备战


3.如何保证不出现重卖?


在业务过程中,我们实现了很多业务,解决了很多困难,我们重点阐述以下两个痛点,一个是恶意锁座,一个是防止超卖。


1)如何解决恶意锁座?


首先我们采用的扣减库存方式是预扣库存,用户操作锁定座位时即锁定库存,那我们如何解决恶意锁座呢?


a)锁座订单中会生成一个“库存失效时间”,超过该时间,锁座订单会失效释放库存;


b)限制用户购买数量,一人最多只能购买 6 张票;


c)接入黄牛防控系统。


2)如何防止库存超卖?


电影票不同于电商业务普通的标品,是不允许出现超卖的情况,否则会出现重票,从而引发客诉舆论问题,所以在库存数据一致性上,需要保障在高并发情况下不出现重票,我们的解决方案是:


a)使用分布式缓存,在分布式缓存中预减库存,减少数据库访问;


b)使用数据库唯一键,在锁座表中,设定场次 Id 和座位 Id 做为唯一键。锁定座位时,如果座位已经售卖,会报出数据库异常,不允许某一个座位重复售卖。

四、总结

回顾电影节抢票,我们首先想到的是能抗高并发流量,能让系统稳定。通过上述章节我们揭开了高性能、高可用等背后的技术,展示了一个典型抢票大战的技术方案,核心技术包括:


  • 让业务赢 = 完整的业务应用 + 支撑核心业务;

  • 高性能、高可用 = 流量削峰 + 限流降级 + 多级缓存;

  • 平台成熟化 = 完善的监控 + 保障方案。


在这个过程中,我们沿着让系统稳定、让业务赢的设计思想,不断的思考和落地这些技术细节,沉淀核心技术,以达到让用户体验流畅的抢票过程。电影行业提升 DCP 传输效率,还能这样做!


作者介绍


阿里文娱高级开发工程师 念贤


相关阅读


电影垂直行业的云智开放平台如何炼成?


阿里工程师带你了解 B 端垂类营销中心如何设计?


云智前端技术如何赋能场馆院线?


2020-03-18 10:001573

评论

发布
暂无评论
发现更多内容

最好用的安卓按钮,含泪狂刷Android基础面试118题

android 程序员 移动开发

最新 Android 热门开源项目公布,androidframework开发书籍

android 程序员 移动开发

教你如何使用Jetpack绘制天气图,史上最详细!,跨平台app开发框架

android 程序员 移动开发

数据结构(三), 弄懂红黑树RBTree(多图警告!!!),帮你突破瓶颈

android 程序员 移动开发

春招结束,腾讯+字节,android移动开发基础案例教程答案

android 程序员 移动开发

最新-Android-面试点梳理,我收藏了你呢?,事件分发机制怎么回答

android 程序员 移动开发

收好这份钉钉和抖音的客户端面经,真的很重要!,ndk开发环境

android 程序员 移动开发

教你如何使用Flutter和原生App混合开发,androidstudio项目实战

android 程序员 移动开发

数据结构篇11、映射Map及其三种底层实现,android插件化框架

android 程序员 移动开发

新鲜出炉的Android面试题,确定不来看看吗?还有超详细的答案解析哦

android 程序员 移动开发

无意苦争春,一任群芳妒!看完这份2020年度大厂Android面试总结

android 程序员 移动开发

插件化库VirtualAPK详解,你头秃都没想到还能这样吧

android 程序员 移动开发

插件化框架解读之android系统服务实现原理(五),毕业工作5年被裁

android 程序员 移动开发

普通程序员,三年成为年薪70w架构师,只因有了这些习惯

android 程序员 移动开发

月薪20+的Android面试都问些什么?,android实战开发记账本app视频

android 程序员 移动开发

数据结构篇09、哈希表--简化版HashMap,一线互联网移动架构师360°全方面性能调优

android 程序员 移动开发

搞了三年Android开发终于把线程、多线程和线程池全搞懂了,掌握这些核心知识(1)

android 程序员 移动开发

收割腾讯等十几个Offer后,揭秘进大厂的秘诀和Android技术面试题汇总!

android 程序员 移动开发

最全-BAT-大厂Java和Android面试题整理!为接下来秋招金九银十做准备(聪明人已经收藏了

android 程序员 移动开发

最后再说一次!!不要在你的App启动界面设置SingleTask-SingleInstance

android 程序员 移动开发

搞Android开发为什么这么难?想哭了!,kotlin中文

android 程序员 移动开发

文档06-H264解码流程,android实战开发项目阅读器

android 程序员 移动开发

教你如何使用Flutter和原生App混合开发(1),Android开发面试解答之Handler

android 程序员 移动开发

文字太多?控件太小?试试 TextView 的新特性 Autosizing 吧

android 程序员 移动开发

插件化框架解读之Class文件与Dex文件的结构(一),Android详解

android 程序员 移动开发

搞了三年Android开发终于把线程、多线程和线程池全搞懂了,掌握这些核心知识

android 程序员 移动开发

曾经身为一名Android面试官的我,如今去别的公司面试被虐成狗!我也有今天7

android 程序员 移动开发

来自Android菜鸟的思考:普通公司的程序员技术跟大厂的差距在哪?怎样才能达到大厂技术水平

android 程序员 移动开发

来自程序员的感叹:我怎么就没有阿里,腾讯,安卓内存监控悬浮窗

android 程序员 移动开发

插件化框架解读之Android-资源加载机制详解(二),kotlin语法印章类

android 程序员 移动开发

揭秘 Android 百万开发被迫转行背后的残酷真相,只是你没找对方向罢了

android 程序员 移动开发

60 秒售出 5 万张票!电影节抢票技术揭秘_文化 & 方法_阿里巴巴文娱技术_InfoQ精选文章