写点什么

Twitter 借助漏斗分析提升用户参与度

  • 2016-02-28
  • 本文字数:1026 字

    阅读完需:约 3 分钟

漏斗分析(Funnel analysis)”用于分析事件序列,帮助网站或移动应用提升用户参与度。为了提升Twitter 用户的参与度, Twitter 的数据科学团队借助这个概念了解用户在注册或发推过程中如何同用户界面交互。他们用它分析用户交互日志,以确保他们交付的产品特性对用户有用且有吸引力。

Krist Wongsuphasawat 是 Twitter 的职业数据科学家,他最近写了一篇有关他们的试验性可视化分析方法的文章。该方法用于特定的事件序列计数,此外,为了提供更广阔的视角,该方法还会聚合并可视化序列中各步骤之间的信息。

日志分析可以像单事件计数那么简单,例如,点击Tweet 按钮。但是,该事件只是打开了Tweet 编辑器,并不一定意味着用户成功发推。漏斗分析或“漏斗计数(counting funnels)”可以提供更宏观的画面,便于查看用户在开始编辑之后中途放弃Tweet 的次数。这会引出更具探究性的问题,但是,Twitter 的数据规模对数据分析提出了挑战。这些数据涉及1 万多种事件类型和数以亿计的用户。Twitter 团队已经构建了一个统一的日志基础设施,用于捕获所有客户端的用户活动,使得这些日志成为组织内最大的数据集之一。

团队设计了一个试验性可视化漏斗分析工具Flying Sessions,用于支持漏斗探究,减少工作量,并提供比简单计数更多的信息。该工具帮助数据科学家理解日志数据。用户可以通过选择部分会话来指定分析粒度。然后,该工具会为用户提供聚合结果,用户可以在可视化界面上交互地探究这些结果。

该方案的数据管道包含三个部分:“会话生成(sessionzation)”、分段和聚合。可视化分析工具用到的技术包括 Hadoop Scalding D3 d3Kit 。Scalding 用于对 Hadoop 中大量的原始日志事件进行过滤,并汇总成较小的 JSON 文件,后者可以通过使用 D3 和 d3Kit 开发的 Web 用户界面可视化。

会话生成阶段会为每个用户创建一个会话,并添加连续事件(按时间戳排序)。

分段阶段会从会话中提取与分析师指定的“对齐点(alignment point)”相关的事件子序列,并根据它们包含的对齐点将子序列分组成段。该阶段包括识别会话片段,然后提取对齐点之间的事件序列并分组。

最后,聚合阶段会通过管道将上个阶段生成的段并行发给各种聚合器,以便生成可以在前端可视化的汇总信息(比如事件平均次数)。这种设计允许在需要额外的汇总类型时添加新的聚合器。

此外,Twitter 团队还设想了几种设计改进,以便将来增加使用模式挖掘或更复杂算法的新聚合类型。

查看英文原文: Funnel Analysis at Twitter for Improving User Engagement

2016-02-28 18:002034
用户头像

发布了 1008 篇内容, 共 399.4 次阅读, 收获喜欢 345 次。

关注

评论

发布
暂无评论
发现更多内容

创建一个springboot服务就是这么简单

乌龟哥哥

6月月更

生态对对碰丨OceanBase如何与Prometheus与Grafana监控结合

OceanBase 数据库

Grafana Prometheus oceanbase

如何快速上手AIRIOT?

AIRIOT

物联网 低代码平台

几经波折,InfluxDB的TSDB C位还能做多久?

CnosDB

IoT 时序数据库 开源社区 CnosDB infra

InfoQ 极客传媒 15 周年庆征文 | 轻量级状态机COLA StateMachine保姆级入门教程

Zhendong

Java 架构设计 状态机 InfoQ极客传媒15周年庆

OceanBase数据库荣获领先科技成果“新技术”奖

OceanBase 数据库

oceanbase 数博会

【愚公系列】2022年06月 二十三种设计模式(二十)-状态模式(State Pattern)

愚公搬代码

6月月更

OceanBase 源码解读(十五):Location Cache 模块浅析

OceanBase 数据库

数据库 oceanbase 源码解读

【动态规划入门篇】只需三步解决它

知心宝贝

算法 前端 动态规划 Leet Code 6月月更

王者荣耀商城异地多活架构设计

大眼喵

「架构实战营」

程序员们,快把这款AI“魔法”做到手机相机里,求求了

最新动态

Oceanbase 读写分离方案探索与优化

OceanBase 数据库

分布式数据库 读写分离 oceanbase

基于 RDMA 的分布式系统研究进展

OceanBase 数据库

RDMA

模块7作业

KennyQ

通用池化框架GenericObjectPool性能测试

FunTester

模块七作业: 王者荣耀商城异地多活架构设计

凯博无线

Vue框架学习笔记 每天学习----四

恒山其若陋兮

6月月更

OceanBase 成为信通院首批可信开源社区、可信开源项目

OceanBase 数据库

开源 oceanbase 信通院

王者荣耀商城异地多活架构设计

dan629xy

[ Kitex 源码解读 ] 代码解读思路的总结

baiyutang

字节跳动 微服务 kitex 6月月更

高性能API网关Kong介绍

天翼云开发者社区

内存数据库和磁盘数据库哪个更强?

OceanBase 数据库

内存数据库 oceanbase 磁盘数据库

聊聊 Sharding-Jdbc 的原理-初篇

Nick

MySQL 分库分表 中间件 ShardingJDBC 6月月更

富滇银行完成数字化升级|OceanBase数据库助力布局分布式架构中台

OceanBase 数据库

分布式数据库 oceanbase

深入浅出 ODP(一):功能模块及特性详解

OceanBase 数据库

数据库 oceanbase

ChainOfResponsibilityPattern-责任链模式

梁歪歪 ♚

设计模式

【Go实现】实践GoF的23种设计模式:原型模式

元闰子

Go 设计模式 原型模式

CommandPattern-命令模式

梁歪歪 ♚

设计模式

idea社区版和商业版有什么区别

源字节1号

软件开发

万物并作,吾以观复|OceanBase 政企行业实践

OceanBase 数据库

数据库 oceanbase

IteratorPattern-迭代器模式

梁歪歪 ♚

设计模式

Twitter借助漏斗分析提升用户参与度_大数据_Srini Penchikala_InfoQ精选文章