9月7日-8日,相约 2023 腾讯全球数字生态大会!聚焦产业未来发展新趋势! 了解详情
写点什么

数十亿用户数据,上千个用户标签维度,用户分析怎么做?

  • 2021-02-25
  • 本文字数:5987 字

    阅读完需:约 20 分钟

数十亿用户数据,上千个用户标签维度,用户分析怎么做?

1 月 14 日,Kyligence 产品经理陈思捷开启了我们在 2021 年的首场线上分享,为大家介绍了用户行为分析的应用场景、以及通过一些行业案例展示如何使用 Kyligence 进行用户行为分析,最后用 Demo 演示了具体的行为分析过程。文章末尾也可以直接观看整个 Demo 过程,更有大家在会上的 Q&A 解答,感兴趣的小伙伴别错过啦。

用户行为分析是什么?

用户行为是指用户为使用产品或获取服务而进行的一系列行动。以网站或者手机应用为例,用户点击按钮、跳出网页、注册等都属于用户行为,而用户行为分析是指对用户行为数据进行分析。


为什么大部分企业都需要做用户行为分析呢?


  • 快速决策。 处理和解释用户行为信息的速度越快,就能更快掌握目前业务状况,从而帮助更早做出决策判断,团队可以第一时间采取措施积极应对。

  • 更完整的用户画像。 基于用户行为数据的这种用户模型中,记录了每个用户的每一次行为,这样可以客观、真实地还原用户与产品的交互过程,从事实的角度帮助构建更加完整、真实的用户画像。

  • 精细化运营。 用户行为数据是动态变化的,随着用户从认知,熟悉,最后成为高价值用户,用户的每个行为都记录了下来。不同阶段的用户可以分别采取有针对性的运营策略。

用户行为分析的应用场景

用户行为分析的典型场景流程就是这样的:


  • 第一步:通过分析埋点数据,还原用户使用产品的全流程路径,可视化显示用户访问路径,从整体的视角查看用户在各个节点上的流量,定位关键路径。

  • 第二步:指定关键步骤进行漏斗分析,得到各个步骤的转化率和流失率,定位转化步骤中的问题节点和客群。

  • 第三步:再将关键步骤中的客群与标签数据联动,得到这客群的价值分布。

  • 最后,有了完善的数据做支持,业务人员不仅能够在指定运营策略的过程中,参考过往的活动数据,做到手中有数,心中有谱。



用户行为分析典型场景流程


所谓自助式闭环分析,就是能够在第一时间,对当前的运营策略进行及时的效果评估,并根据具体情况和必要性进行快速调整,将运营活动的效果进一步优化。产品调整或运营活动执行之后进行效果追踪,又可以将结果反馈到路径分析环节中,来得到优化后的直观展示。


接下来看看用户行为分析在各行各业中有哪些实践应用?

金融领域,提高订单的转化率

在金融领域中,对于理财类产品的运营人员,首要关注理财产品订单转化率。理财 APP 中一个典型的用户行为路径是:用户先浏览详情页之后,加入购物车,提交订单,最后到成功支付。


为了提高订单的转换率,需要分析用户从看到商品,到最后支付成功的各个环节的流程。定位流失率高的步骤,分析此步骤中流失用户有什么特点,用于指导产品优化;



如果发现加入购物车步骤流失较高,且发现这部分流失用户的设备类型 75% 都是安卓,这可能说明了安卓系统的 APP 加入购物车页面、按钮有问题。通过修复安卓版本 APP,从而提高了订单成单数量。


利用好用户行为分析,就可以对产品、服务进行优化从而引导用户进行转换,或者引导用户进行复购。

社交领域,注重用户获取

在社交领取中,分析人员特别注重的是用户从哪个搜索引擎带来的流量、点击哪个入口进入社交网站界面,且注册成功、以及在社交网站中参与社交互动的行为和频次。通过分析新用户从开始使用到参加社交这个过程的转化情况,进行渠道资源评估、投放效果评估,找寻最佳拉新渠道资源。

零售领域,关心营销优化

在零售行业的促销活动中,营销人员首先通过分析以往的历史数据,找出一批优质的高价值用户名单,例如近七天之内未访问平台的用户,然后在推送平台中发送短信,用户收到短信后,点击链接领取优惠券,吸引用户进行消费;再通过一定时间的观察以后,针对完成首单的用户通过 APP 推送的方式发放优惠券,刺激二次消费。这个过程中,就需要分析用户的转化行为和留存行为。


综上,在接触到的许多客户案例中,特别是精细化运营过程中都需要构建个性化的用户旅程,在用户旅程的不同时机,适时传递用户所需,从而提升用户转化和留存。但随着移动化、数字化、智能化不断加强,各大企业持续加大对线上渠道的建设投入,线上的用户数不断增加,用户行为数据量也在增加。而进行用户行为分析,总是会遇到难点。

用户行为分析的现状及挑战

对于许多大型企业来说,日常面对数十亿用户数据,上千个用户标签维度,用户行为分析就面临巨大挑战。


首先是底层的数据结构无法支撑复杂的分析需求,此时需要技术人员投入大量精力和时间,来进行跨表、跨库的查询,处理无法被复用的数据请求。在灵活的维度组合下,分析人员无法快速得到查询结果,甚至计算不出结果。


数据割裂也是用户关心的问题。当数据散落在多个系统中时,就无法支持多维度的下钻分析或精细分析。无法进一步分析查看用户明细和用户特征,行为分析流于表面,只有转化表现而缺乏转化原因的探查入口。


进行用户行为分析时,由于 SQL 难度高,业务人员需要依赖大数据部门或者研发部门排期编写、维护 SQL 逻辑,不仅维护困难,开发周期还很长。当有业务调整需要时,又需要另外的开发周期,无法快速响应业务上的诉求。


如何应对海量数据、多维度、高基数的分析挑战?


  • 首先需要更强大的计算引擎提供分析,支持海量数据分析和低延迟;并且在数据量增长、业务需求增长的情况下,保证稳定的查询体验。

  • 其次,我们需要一个统一的数据模型,帮助企业创建数据资产之间的关联,以获得对数据更全面的视角。还应支持数据导出,与画像系统联动、与营销系统打通。

  • 最后,应该提供拖拽式的行为分析。用户根据相关业务,灵活地创建图表,分析自己想要看的行为数据。易学易用,快速上手。不仅如此,用户还可以灵活的多维选择进行组合查询、下钻分析和明细信息查询。



总结一下,强大的计算引擎、统一的数据模型和自助式的分析体验是企业在大数据场景下做好用户行为分析的关键。

Kyligence 如何助力企业用户行为分析

技术架构

下图中底层蓝色的部分是 Kyligence 的数据处理计算部分,依托于存储与计算分离的特性以及预计算能力,Kyligence 能够很好地满足在海量数据场景下的数据高效计算能力。同时 Kyligence 还提供了完善的企业级平台运维处理能力,支持多种架构满足各类客户的场景需求。



Kyligence 用户行为分析功能架构


往上,通过 Kyligence 多维数据模型框架,对用户基础数据进行语义分类和转化,提供多种维度分类的数据主题模型。基于这些数据主题模型,就可以直接对接应用分析端进行常用的事件分析,漏斗分析,留存分析了。


总结下 Kyligence 用户行为分析的解决方案主要有以下 4 点强大功能:


  • 支持从多种数据仓库、数据湖加载数据,进行海量数据的存储,为全时间段、全维度分析提供基础,实现海量数据融合查询与统一管理 ;模型预计算技术,分析击中预计算不重复计算,不断复用预计算结果,提升查询的速度和性能,同时,查询的性能随业务的增长也不会受到影响。

  • 利用 Bitmap 计算 提供了高基数维度的精确去重计算 ,满足真实场景中的用户行为分析需求。

  • 提供了高性能的查询保障和交互式的分析需求 ;拖拽式开发报表,解耦 IT 人员的依赖,赋能更多业务人员,充分发挥业务人员的聪明才智,大幅度的缩短业务策略的落地实施周期。

  • 通过 Kyligence 将用户行为数据、用户标签数据打通,业务人员基于统一的业务数据集进行自助式分析 。将精确用户 ID 数据导出到其他系统,支持后续营销活动。

典型分析场景应用

1)事件分析


对行为事件进行分析,主要应用于统计和追踪用户行为或业务过程。拿理财 APP 为例,用户先浏览详情页再加入购物车,提交订单,最后点击成功支付。在这个过程中,对应了 APP 中的按钮点击事件、曝光事件、加载事件,可以对这些事件进行统计、分组,或是筛选,可以回答以下问题:


  • 每天成功购买的用户数是多少?

  • 每天各个时段浏览量、浏览用户数的变化?

  • PV、UV 数的变化趋势是什么?


还可以根据设备、APP 版本等维度进行对比统计分析,回答关于变化趋势、维度对比的各种细分问题。


在用户统计中,UV 的计算并不是简单粗暴的统计相加,而是需要依据用户唯一的识别符,例如用户 ID,或者 IOS 广告标识符 IDFA,或是 IMEI 等,根据这些标识符来做去重计算。而对于多维度下的 UV 查询,则需要根据分析人员的查询条件来实时地做去重计算。


相对于传统技术中大量依赖人力的去重分析,使用 Kyligence 产品提供的精确去重技术就可以实现超高基数的 UV 分析。


2)全路径转化效果分析


全路径分析提供了流量的全局分析视角,在图表可以看到不同节点之间的流量走向。由此可以判断各个页面之间的流量配比是否满足预期,并查看整体路径/节点的转化率是否正常。



通过用户全路径分析,还能找出用户实际访问的关键路径,例如可以得到转化率较高的路径中用户是否成功注册,以及产生购买行为;或者转化率较低的路径中用户是否实际到达登录步骤等。


3)漏斗分析


漏斗分析是对产品中、营销活动一系列关键节点的转化分析和流失分析。利用漏斗分析,可以轻松看出各个步骤之间转化情况和流失情况的比较。业务人员通过拆解业务流程,并在 Kyligence 中按照关键流程节点来自定义漏斗分析步骤,就可以很快发现重要的路径上是否有转化异常的情况。


通过增加或者调整步骤的顺序,可以进行更细粒度的转化率分析。使用更改筛选条件,还可以直接比较不同人群的转化效果。



4)用户标签分析与漏斗分析联动


用户标签分析,通过标签筛选,帮助业务人员通过页面点选标签的方式,圈选出目标群体用户,进而实现精准营销。


标签可以按照用户的基本属性来分析:例如有年龄分段、性别、地理等信息,来反映用户群体的大致形象;或者根据 CRM 系统中同步的信息:对客户等级信息,保险、贷款等客户标签进行展现;再抽取业务相关的属性,例如对于理财产品:有历史累计交易金额、历史购买过理财产品、当前持有资产等标签。


通过这些标签,再联动漏斗分析,就可以精准定位关键步骤中的流失人群,并了解价值分布,为产品设计、精准营销提供依据,进行客户挽回。


案例解读

物流运输平台

背景介绍:每天产生近 10 亿的流量数据,需要响应业务方的多维查询、自定义漏斗分析、留存分析、用户画像等流量分析需求。


作为全国最大的车货匹配信息平台,这个平台上连接着上千万的司机和货主用户,这些用户每天都会访问平台各种各样的产品来进行发货、找货,或使用一些加油、ETC 充值、借贷的服务。平台每天会产生近十亿的流量数据,近半年的数据累计甚至达到了千亿级。


这些流量数据记录着非常丰富的用户行为。所以无论哪条业务线,无论是管理者、数据分析师、产品经理,还是运营人员,都非常希望深入分析流量数据,以此来洞察用户,为各项业务的展开提供决策支持。


在接入 Kylin 的技术以前,他们的业务人员以人工提数的方式处理流量分析需求。业务人员每周会把需求提交给数据分析师,数据分析师进行排期、写 SQL 提数,最后把数据反馈给需求方。这种方式非常的原始低效,一方面,业务人员要等较长的时间才能拿到结果;另一方面,人工处理需求的成本非常高,需要数据分析师全力投入来支持。因此,他们希望做到快速地响应业务方的多维查询、漏斗分析等流量分析需求。


在使用 Kylin 技术后,IT 人员只需要对数据进行简单的处理和转化,配置模型,然后构建数据。业务人员在前端展现平台进行查询,平台根据查询条件生成相应 SQL 语句下发到查询引擎,就可以得到结果。


整体实现了以下多个分析场景:


  • 多维查询: 系统有十多个维度可以相互交叉分析,并且和任意日期关联。

  • 虚拟埋点分析: 虚拟埋点就是由几个埋点组合成的埋点。在很多场景下,只查询单个埋点的行为数据是不够的。而虚拟埋点的转化分析涉及到多个埋点先做并集,再做交集的 UV 聚合去重。对于这种复杂分析需求,业务用户只需要把这个虚拟埋点具体包含哪些埋点告诉系统,系统会自动地生成 SQL 去查询。

  • 自定义漏斗 :在这个方案中,利用 Kylin 提供的交集函数,可以在前端自定义漏斗配置后即刻返回数据的效果。


从时间成本上来看,新的方案实现了 T+0 的流量数据查询,端到端的延迟大概是 15 分钟左右。显然,新的实现方式能够更近一步支持精细化的流量分析,提供丰富的维度、T+0 的数据、即时灵活的自定义数据,让系统的功能得到了非常强大扩展。


房地产开发商

背景介绍:后台数据每天按日更新,并且日均数据量都会在百 G 以上,需要对业主特征,房产特征,活动营销进行快速分析响应。


第二个案例是国内知名的房地产开发商,通过一整套垂直行业的用户画像系统,持续给他们的客户营造高品质的房产品和生活服务。这个系统利用了 Kylin 技术加速主要数据服务,有效提升了互联网广告推广、营销服务的效率。


系统中融合各业务系统数据,包括线下房产、4S、商业园区、线上 APP 的服务数据,完成客户全生活链用户画像的建设。线下交易数据,联动线上的埋点行为数据,为数字化营销建立更为准确优化的策略,从而真正做到“数据驱动营销”。


后续,这套系统会融入知识图谱,建立业主与业主、业主与房子之间的连接,从而形成一套更加全面、可视化的用户行为画像系统。


以上就是 Kyligence 对于用户行为分析的方案及案例介绍,如果您还想了解实际的操作,可以点击以下视频了解 Demo 操作的全过程。


完整视频


如果你想亲自体验使用 Kyligence 助力企业用户行为分析,点击「阅读原文」填写信息,全程免费的测试场景,等你来体验!

现场 Q&A

Q: 请问用户路径分析中步骤需要提前预设值吗?其中的 Null 是指?


A: 路径分析图中的步骤都是根据数据自动生成的。例如数据中存在步骤 A -> 步骤 B 有 800 人,则路径分析图中就会展示步骤 A -> 步骤 B 中的流量为 800,无需手动设定步骤。当数据中存在 Null 时,会把 Null 也认为是一个步骤。


Q: 请问分析的结果是否可以推送或者分享到其他的平台(比如报表平台)?


A: 分析的结果可以通过 csv、xlsx 的方式下载下来,也可以直接将报表链接分享。


Q: 如果用户行为类型有多种,这个在数据模型建设的时候是先将这些数据整合在一起,然后加载至 Kylin,接下来再针对不同的分析主题建设不同的 Cube 嘛?


A: 数据建多少个模型和 Cube 取决于数据采集、数据处理的方式。可以将不同类型的数据创建为不同模型,基于不同模型来创建后面的图表;也可以整合到一个模型当中支撑分析。当然根据具体情况的不同,解决方案也不同。如果需要具体讨论,您可以在 Kyligence 微信后台详细描述您的场景以及遇到的问题,期待和您进一步交流。


Q: 这里演示的功能是基于行为明细和画像标签实时聚合计算的吗?和开源 Kylin 预计算的技术架构是不是不太一样?


A: 在 Demo 演示中,展示了漏斗分析图和用户画像相关的图表之间的联动。图表的查询击中了行为数据的预计算模型和标签数据的预计算模型。这与开源 Kylin 预计算的技术是一样的。


Q: 有没有更多营销案例,怎么筛选客户对其进行精准营销?


A: 您可以阅读以下内容了解更多详情~


1)【附 PPT】精细化运营积分商城,关键技术是?


2)金融科技系列 |如何 0-1 快速构建数字化客户运营体系


本文转载自公众号 Kyligence(ID:Kyligence)。


原文链接


数十亿用户数据,上千个用户标签维度,用户分析怎么做?

活动推荐:

2023年9月3-5日,「QCon全球软件开发大会·北京站」 将在北京•富力万丽酒店举办。此次大会以「启航·AIGC软件工程变革」为主题,策划了大前端融合提效、大模型应用落地、面向 AI 的存储、AIGC 浪潮下的研发效能提升、LLMOps、异构算力、微服务架构治理、业务安全技术、构建未来软件的编程语言、FinOps 等近30个精彩专题。咨询购票可联系票务经理 18514549229(微信同手机号)。

2021-02-25 10:005067

评论

发布
暂无评论
发现更多内容

Java-进阶:多线程2

爱好编程进阶

Java 程序员 后端开发

Kubernetes 如何将 Pod 分配给节点

玄月九

Kubernetes 污点 亲和 反亲和 容忍

在线Excel转XML工具

入门小站

工具

Java 总结:各种排序算法的介绍及其之间的对比差异

爱好编程进阶

Java 程序员 后端开发

一、何为应用系统高可用

穿过生命散发芬芳

5月月更

模块四作业(试卷存储设计)

天琪实刚亮

M4: 设计千万级学生管理系统的考试试卷存储方案

Jadedev

架构实战营

maven构建docker镜像三部曲之一:准备环境

程序员欣宸

Java Docker 5月月更

DDD实战(9):冲刺1战术之服务设计(上)

深清秋

DDD 软件架构 生鲜电商系统

[Day32-03]-[二叉树]不同的二叉搜索树

方勇(gopher)

LeetCode 二叉树 动态规划 数据结构和算法 卡特兰数

Kotlin 中的泛型:协变与逆变

如浴春风

5月月更

Docker入门

爱好编程进阶

Java 程序员 后端开发

面向快速反应的工程团队--QRF团队模型

俞凡

管理 研发效能

软件架构的23个基本原则

俞凡

架构

千万级学生管理系统的考试试卷存储方案

鱼恨水

千万级学生管理系统的考试试卷存储方案

CityAnimal

架构实战营 #架构实战营 架构师实战营 「架构实战营」

这个页面效果看起来真恶心,怎么解?

石云升

团队管理 项目管理 职场经验 5月月更

今天是第几周

入门小站

工具

Java 之 SpringMVC(一篇文章精通系列)

爱好编程进阶

Java 程序员 后端开发

前端食堂技术周刊第 35 期:Vitest v0.10.0、Jest 28、Ant Design v4.20.0、Lerna 官宣停止维护、UnoCSS 交互式

童欧巴

JavaScript web前端 前端工程师

使用PIL.Image库极简生成含冬奥会元素头像

芝士味的椒盐

Python 冬奥会 5月月更

Hadoop全分布式部署

芝士味的椒盐

Java 大数据 hadoop 5月月更

【愚公系列】2022 年 05月 二十三种设计模式(一)-工厂方法模式(Factory Method Pattern)

愚公搬代码

5月月更

网站开发进阶(二)阿里云将80端口请求转发到其他端口

No Silver Bullet

5月月更 端口转发 端口映射

2022必会的前端手写面试题

buchila11

前端面试

关于“运放“这些知识点

謓泽

5月月更

这是一篇关于哈希表的爽文

武师叔

5月月更

[Day32-02]-[二叉树]在二叉树中增加一行

方勇(gopher)

LeetCode 二叉树 数据结构和算法

dubbo + zookeeper + spring 分布式系统

爱好编程进阶

Java 程序员 后端开发

IntelliJ IDEA开发最佳配置

爱好编程进阶

Java 程序员 后端开发

linux之登录式shell和非登录式shell

入门小站

Linux

  • 扫码添加小助手
    领取最新资料包
数十亿用户数据,上千个用户标签维度,用户分析怎么做?_大数据_apachekylin_InfoQ精选文章