写点什么

Twitter 借助漏斗分析提升用户参与度

  • 2016-02-28
  • 本文字数:1026 字

    阅读完需:约 3 分钟

漏斗分析(Funnel analysis)”用于分析事件序列,帮助网站或移动应用提升用户参与度。为了提升Twitter 用户的参与度, Twitter 的数据科学团队借助这个概念了解用户在注册或发推过程中如何同用户界面交互。他们用它分析用户交互日志,以确保他们交付的产品特性对用户有用且有吸引力。

Krist Wongsuphasawat 是 Twitter 的职业数据科学家,他最近写了一篇有关他们的试验性可视化分析方法的文章。该方法用于特定的事件序列计数,此外,为了提供更广阔的视角,该方法还会聚合并可视化序列中各步骤之间的信息。

日志分析可以像单事件计数那么简单,例如,点击Tweet 按钮。但是,该事件只是打开了Tweet 编辑器,并不一定意味着用户成功发推。漏斗分析或“漏斗计数(counting funnels)”可以提供更宏观的画面,便于查看用户在开始编辑之后中途放弃Tweet 的次数。这会引出更具探究性的问题,但是,Twitter 的数据规模对数据分析提出了挑战。这些数据涉及1 万多种事件类型和数以亿计的用户。Twitter 团队已经构建了一个统一的日志基础设施,用于捕获所有客户端的用户活动,使得这些日志成为组织内最大的数据集之一。

团队设计了一个试验性可视化漏斗分析工具Flying Sessions,用于支持漏斗探究,减少工作量,并提供比简单计数更多的信息。该工具帮助数据科学家理解日志数据。用户可以通过选择部分会话来指定分析粒度。然后,该工具会为用户提供聚合结果,用户可以在可视化界面上交互地探究这些结果。

该方案的数据管道包含三个部分:“会话生成(sessionzation)”、分段和聚合。可视化分析工具用到的技术包括 Hadoop Scalding D3 d3Kit 。Scalding 用于对 Hadoop 中大量的原始日志事件进行过滤,并汇总成较小的 JSON 文件,后者可以通过使用 D3 和 d3Kit 开发的 Web 用户界面可视化。

会话生成阶段会为每个用户创建一个会话,并添加连续事件(按时间戳排序)。

分段阶段会从会话中提取与分析师指定的“对齐点(alignment point)”相关的事件子序列,并根据它们包含的对齐点将子序列分组成段。该阶段包括识别会话片段,然后提取对齐点之间的事件序列并分组。

最后,聚合阶段会通过管道将上个阶段生成的段并行发给各种聚合器,以便生成可以在前端可视化的汇总信息(比如事件平均次数)。这种设计允许在需要额外的汇总类型时添加新的聚合器。

此外,Twitter 团队还设想了几种设计改进,以便将来增加使用模式挖掘或更复杂算法的新聚合类型。

查看英文原文: Funnel Analysis at Twitter for Improving User Engagement

2016-02-28 18:001979
用户头像

发布了 1008 篇内容, 共 393.7 次阅读, 收获喜欢 345 次。

关注

评论

发布
暂无评论
发现更多内容

极客星球 | 数据智能公司K8S生产环境落地之监控篇

MobTech袤博科技

K8s 多集群管理

Twitter架构决策

俞凡

架构 大厂实践

朋友圈架构设计

踩着太阳看日出

架构训练营

不断挖掘“区块链”更大潜能

CECBC

内容管理系统简史

张泽豪

CMS

模块二作业 -- 图片字小,可以放大网页观看

库尔斯

带你了解元宇宙

CECBC

PlatoFarm将DAO理念发扬光大,让DAO社区受益才能走得远

西柚子

linux之type命令

入门小站

Linux

在线SQL压缩工具

入门小站

工具

基于HiKariCP组件,分析连接池原理

HikariCP 连接池 数据库连接池

尤达 DDD 领域驱动设计思想 第五章作业(使用微服务框架对 SmartRM 系统重新进行微服务化重构)

代廉洁

尤达DDD领域驱动设计思想

架构实战营【模块二】作业

michael

架构实战营 「架构实战营」

k8s TLS bootstrap解析-k8s TLS bootstrap流程分析

良凯尔

容器 云原生 kubeadm #Kubernetes#

RabbitMQ 补偿机制、消息幂等性解决方案

Ayue、

RabbitMQ 4月月更

企业如何度量研发效能?

爱吃小舅的鱼

jackson学习之五:JsonInclude注解

程序员欣宸

4月月更

在线计算两个时间相差多少秒,分钟,天

入门小站

工具

架构实战营 - 第 6 期 模块二课后作业

乐邦

「架构实战营」

RocketMQ—Producer(四)消息发送流程

IT巅峰技术

训练营作业-Module2:朋友圈高性能复杂度分析

Jadedev

架构训练营

元宇宙大热,是风口还是虎口

CECBC

云原生训练营 -Week08

jjn0703

模块二

Geek_5hnu3d

PlatoFarm将DAO理念发扬光大,让DAO社区受益才能走得远

小哈区块

RocketMQ—Producer(三)发送方式和消息类型

IT巅峰技术

一文简述:企业应用架构演进史

穿过生命散发芬芳

4月月更

微信朋友圈的高性能复杂度

唐诗宋词

Flutter 通过自定义路由拦截实现权限管理

岛上码农

flutter ios 移动端开发 安卓开发 4月月更

有没有一件你认为是成功的,能让自己骄傲的事情?

石云升

职场经验 4月月更

ECharts 饼图颜色设置教程 - 4 种方式设置饼图颜色

蒋川

eCharts

Twitter借助漏斗分析提升用户参与度_大数据_Srini Penchikala_InfoQ精选文章