写点什么

Twitter 借助漏斗分析提升用户参与度

  • 2016-02-28
  • 本文字数:1026 字

    阅读完需:约 3 分钟

漏斗分析(Funnel analysis)”用于分析事件序列,帮助网站或移动应用提升用户参与度。为了提升Twitter 用户的参与度, Twitter 的数据科学团队借助这个概念了解用户在注册或发推过程中如何同用户界面交互。他们用它分析用户交互日志,以确保他们交付的产品特性对用户有用且有吸引力。

Krist Wongsuphasawat 是 Twitter 的职业数据科学家,他最近写了一篇有关他们的试验性可视化分析方法的文章。该方法用于特定的事件序列计数,此外,为了提供更广阔的视角,该方法还会聚合并可视化序列中各步骤之间的信息。

日志分析可以像单事件计数那么简单,例如,点击Tweet 按钮。但是,该事件只是打开了Tweet 编辑器,并不一定意味着用户成功发推。漏斗分析或“漏斗计数(counting funnels)”可以提供更宏观的画面,便于查看用户在开始编辑之后中途放弃Tweet 的次数。这会引出更具探究性的问题,但是,Twitter 的数据规模对数据分析提出了挑战。这些数据涉及1 万多种事件类型和数以亿计的用户。Twitter 团队已经构建了一个统一的日志基础设施,用于捕获所有客户端的用户活动,使得这些日志成为组织内最大的数据集之一。

团队设计了一个试验性可视化漏斗分析工具Flying Sessions,用于支持漏斗探究,减少工作量,并提供比简单计数更多的信息。该工具帮助数据科学家理解日志数据。用户可以通过选择部分会话来指定分析粒度。然后,该工具会为用户提供聚合结果,用户可以在可视化界面上交互地探究这些结果。

该方案的数据管道包含三个部分:“会话生成(sessionzation)”、分段和聚合。可视化分析工具用到的技术包括 Hadoop Scalding D3 d3Kit 。Scalding 用于对 Hadoop 中大量的原始日志事件进行过滤,并汇总成较小的 JSON 文件,后者可以通过使用 D3 和 d3Kit 开发的 Web 用户界面可视化。

会话生成阶段会为每个用户创建一个会话,并添加连续事件(按时间戳排序)。

分段阶段会从会话中提取与分析师指定的“对齐点(alignment point)”相关的事件子序列,并根据它们包含的对齐点将子序列分组成段。该阶段包括识别会话片段,然后提取对齐点之间的事件序列并分组。

最后,聚合阶段会通过管道将上个阶段生成的段并行发给各种聚合器,以便生成可以在前端可视化的汇总信息(比如事件平均次数)。这种设计允许在需要额外的汇总类型时添加新的聚合器。

此外,Twitter 团队还设想了几种设计改进,以便将来增加使用模式挖掘或更复杂算法的新聚合类型。

查看英文原文: Funnel Analysis at Twitter for Improving User Engagement

2016-02-28 18:002123
用户头像

发布了 1008 篇内容, 共 409.7 次阅读, 收获喜欢 346 次。

关注

评论

发布
暂无评论
发现更多内容

这5个浏览器工具,让你的上网舒适度提升150%

彭宏豪95

效率 工具 浏览器 脚本 5月日更

DDD这样落地

码农戏码

DDD

没有发生GC也进入了安全点?这段关于安全点的JVM源码有点意思!

CoderW

Java 源码分析 JVM GC

Redis - 列表

旺仔大菜包

redis

Impala架构剖析

大数据技术指南

大数据 5月日更

实时音视频通讯过程中声音的那些事儿

liuzhen007

音视频 5月日更

谈一谈“数字资产”

小天同学

思考 数字时代 5月日更 数字文物 数字内容

线性表,栈,队列,数组草图

鲁米

架构实战营 - 模块 4- 作业

泄矢的呼啦圈

架构实战营

大数据中的工作流调度

五分钟学大数据

大数据 5月日更

想要做网页游戏怎么办 ?PixiJs 篇(四)

空城机

JavaScript 大前端 游戏 pixi 5月日更

从 Netflix 到 Alibaba,Spring Cloud 更好了吗?

博文视点Broadview

领域驱动设计101 - 实体

luojiahu

领域驱动设计 DDD

带你认识时域、频域与Android系统Visualizer

Changing Lin

音视频 5月日更

测试开发需要掌握哪些技术?

夏兮。

方法论 测试 CI/CD automation 语言 & 开发

项目管理学习到的教训

胡迪伦

项目管理

架构实战营 - 模块 4- 作业

请弄脏我的身体

架构实战营

Android 音视频采集那些事

LoveYFan

音视频

学会这12个Java开发框架轻松拿到30K+

北游学Java

Java spring Netty mybatis 框架

什么是线程安全?一文带你深入理解

程序猿阿星

线程安全 信号量 线程同步 互斥锁

后悔:要是当初那样就好了

石云升

思维方式 5月日更 后悔 人生选择

实时语音如何过质量关?

cv君

深度学习 算法 音视频 引航计划

架构实战训练营 - 模块四课后作业

Johnny

架构实战营

【LeetCode】数组中两个数的最大异或值Java题解

Albert

算法 LeetCode 5月日更

🚀【高并发技术专题】你需要了解的秒杀方案

码界西柚

高并发系统设计 高并发优化 5月日更

学习笔记之:孩子学习老是跑?日更好“难”

Nydia

学习

(深入篇)漫游语音识别技术—带你走进语音识别技术的世界

攻城先森

深度学习 音视频 语音识别 5月日更

架构师实战营 模块四作业(设计千万级学生管理系统的考试试卷存储方案)

代廉洁

架构实战营

架構實戰營 - 模塊 4 作業

Frank Yang

架构实战营

架构训练营模块4作业

Geek_649372

架构训练营

面试被问 Spring cloud 上下文,可以这样回答

Damon

spring SpringCloud 5月日更

Twitter借助漏斗分析提升用户参与度_大数据_Srini Penchikala_InfoQ精选文章