产品战略专家梁宁确认出席AICon北京站,分享AI时代下的商业逻辑与产品需求 了解详情
写点什么

用户画像技术及方法论

  • 2020-06-02
  • 本文字数:7257 字

    阅读完需:约 24 分钟

用户画像技术及方法论

导读: 用户画像也是近几年比较热的一个词,不过很多小伙伴对于画像的认知还只是标签化的层面,或者只是利用其做一些简单的分群分析;如何全面地认知并做系统性地尝试,背后有非常多的点需要我们深思挖掘。今天就根据自己的一些浅见进行分享,因为与商品画像的联系,中间也会掺杂一些商品画像的知识。如果不足和错误之处,还望大家批评指正,以下 enjoy~


今天的分享主要介绍如何通过用户及商品画像来构建数字化体系,前面是整个内容的概述,然后从浅到深我们去挖掘和讲解其中的各个模块,由于时间的原因,我们会主要通过用户画像展开,对于重要或者有意思的商品画像相关的点会略做辅助性的介绍。



首先我们来看一下什么是 互联网公司的核心 。鄙人的浅见是围绕商品、供应链、物流、营销活动等的整个购物旅程背后的 用户体验



既然用户体验非常重要,那如何去度量和优化整个流程呢,那就是站在用户角度收集其在各个模块的数据,并利用统计、概率思维建模分析;在产品运营、增长过程中找到雪球效应的撬动点施以影响,最终建立起良性的闭环。



作为互联网从业人员,其实我们常有一些困惑,产品的用户是谁?他们是否满意?产品是否健康?有哪些问题?如何才能服务好我们的用户,并且让彼此的收益最大化?


如何去构建起更多用户使用的产品,如何创作一个更多用户喜欢的课程?就像小破站(B 站)的成长中一直在解决问题,如何突破二次元的定义,如何将用户圈层拉开,如何让尽量多的人能在 B 站找到自己喜欢的内容,如何做到存量用户保有及增量用户拉取。当然肯定不存在每个人都满意的产品和课程,但是如何在现有体系下去最大化满意度呢?这个我觉得是大家希望得到答案的根本。



那其中的一个手段就是以增量用户拉取,存量用户数量和价值的保有为目标,利用大数据技术精准用户画像,并结合商品画像,解构用户及商品,精细化耕作,最终在重点目标客户群体上形成突破。比如电商猜你喜欢中的个性化推荐技术,万能的淘宝上有海量的商品几乎可以满足每个人的采购商品需求,但是如何让一个用户可以精准快速地找到是大问题,个性化是其根本,用户画像和塑造则是个性化的根本,希望可以让用户感受到产品为 ta 而造的满足感。


如何解构用户呢,举一个例子就是说当你很了解某一个人的时候,你跟 ta 一起去吃饭,你如果在之前历次跟 ta 的进餐中收集了 ta 喜欢及不喜欢吃什么(用户动态数据),然后 ta 的性格是怎么样的(比较犹豫)(用户数据),是不是喜欢吃辣(用户数据),然后你再结合有哪些菜、是不是辣的(商品静态数据),两端做匹配就可以提供更好的体验了。所以不是单单用户画像,商品画像或其它维度也是需要,最重要的是匹配。



然后我们来看看目录,第一部分是说 what,就是什么是用户画像;第二部分是说 why,为什么我们需要用户画像以及精细化运营;然后第三部分是 how,我们如何构建商品和用户画像;第四部分是举例,是一些方法论的介绍;最后,我们做一个整体的总结。



课程目标是希望通过分享,首先让大家去了解到用户画像和商品画像,整体概念框架以及构建的一些方法;熟悉常见的商品和用户画像的一些应用;尝试结合自己的工作做一些实践。出于对于过往公司数据及技术的保密,无法直接分享给大家特别细粒度且对应的数据。所以分享过程中我会结合业界的一些案例,以及其他前辈公开在网上的分享内容和数据,帮助大家去理解整个应用。

01 什么是商品/用户画像


首先我们来看一下什么是用户画像,根据维基百科的定义,用户画像就是与该用户相关联的数据的可视化的展现,一句话来总结就是用户信息标签化。从用户海量的信息里面去找到一些标签,为用户去贴上这些标签,当然这些标签的来源就是一些用户的行为。



举个范冰冰的例子,客户这个实体通过客户信息的收集,映射到一个客户的画像,最终通过这些画像来建立认知,比如说范冰冰是一个演员,是一个女性,有参加过哪些电影节等。当然你会问那上面的这些标签有什么用呢?这会根据具体的业务场景来定,有些标签在 X 场景下它是没用的,在 Y 场景下则可能非常有用,当然这也提前说明了画像构建的过程肯定是需要与业务结合的展开。




比较常见的画像是我们需要建立平台客户群体化认知时,我们需要借助可视化的标签,我们看一下京东的一个食品用户画像。对于食品这个业务场景,平台上购买的用户他们是长成什么样的?比如性别比例,蓝领与白领占比,评价敏感的人的占比等,通过拉平垂类偏好用户画像与全站的对比,来寻找差异点和优化点。



举个例子来说,你是抢购秒杀频道的运营负责人,你通过类似的上述分析,找到了秒杀频道和全站的用户画像差异点,那有什么用呢?比如我们发现秒杀频道女性用户或者大龄女性用户,相对于全站占比高很多,然后我们通过全站分析出这类用户喜欢购买的品类是 A、B、C;但是频道内我们发现几乎没有 A、B、C 这些品类的商品,或者 A、B、C 这些类目的价格段高了很多,甚至是大量的男性商品。那我们马上就找到了一个优化点,是否可以在该场景做一些品类和商品的调整进行一些测试,可能就会在测试中找到明显的提升。


再比如食品品类下的商品运营如何去拓宽自己的流量池,通过类似上述的分析,比如在一个某个频道发现有非常多的 18-30 岁的男性,并他们在平台有非常多的电子类产品的购买,结合你的专家知识,你的碳酸饮料是否可以考虑进入这个频道呢。


上面的是较直观的应用,进一步其实我们可以借助算法挖掘群体偏好(没有算法基础的可以略过),对频道内商品做进一步改造。比如我们通过算法可以对近 N 天频道内的用户,通过算法进行商品召回和排序生成全站他们购买的商品,再通过用户在频道的活跃度和频道 LTV 对这些商品通过 embeding 后的向量进行归约,形成最终的 300 或者 500 个商品池,这些商品是你典型用户的一个集合,可以与你现有的商品集合进行融合测试,会有不错的收益。用户消费购物非常复杂,需要根据具体的业务场景去展开的,上述方法不一定适用所有的业务,不同的业务场景需要做调整和适配。



顺便介绍一下什么是商品画像,可以简单的理解为商品画像如同用户画像一样,可以简单理解成是商品海量数据的标签,根据商品的特征、设计、功能、口味、波次、价位段、流行度、销售状况、促销力度、销售渠道差异,将他们区分为不同的类型,然后每种类型中抽取出典型特征,赋予名字、特点、场景、统计学要素等描述。




其实商品和用户画像有很多交集和互相交互的,比如商品有个标签是适用人群,比如女性或者男性,可能就是有很多女性用户经常购买,或者说用户经常购买某个品类或者某种颜色的商品,那用户就可以贴上类似的标签。商品有了标签,运营在做活动的时候,就可以根据活动首页和分会场人群定位,去选品、氛围塑造,比如时尚会场的商品池选取,比如对于履约不好(拒收、退货、低评分)的、高点击 &低转化商品的控制。


02 为什么需要商品/用户画像


为什么需要用户画像呢?其实在用户使用产品的过程中,如果我们做了对的事情让用户的体验非常棒,然后其实我们就可以有不错的收益。但如果我们做了用户体验较差的事情,损失会非常巨大。



如何在企业商业化过程中与用户达成双赢是需要逐步来探索的,一种途径是通过数据去驱动决策,做到利益最大化,也就是这里分享的。通过用户和商品画像找到并更好地服务为你产品买单的那一群人。




通过初期形成的产品,形成了我们平台的一些忠实的客户,对于这部分群体的解读,就可以驱动产销配一体化。需求(用户)与供给(商品)两端的匹配 GAP 的存在,可以推动精准的供给体系构建,比如 C2M、C2B 的可能尝试。




宏观和微观上我们看看画像的作用,微观上主要是精细化,比如推荐、搜索、精准营销、定向投放、风控、定量和定性的分析、数据化的运营用户分析。宏观上来说就是具象化对于用户的认知,在探索用户足迹的过程中,建立市场细分和用户分群。



这里顺便讲一下商品画像的作用,商品画像的前台作用更多是在流量分发上与用户画像的 match,关联后的一些推荐、精准推送等。比如用户标签为 a 类目的价格段偏好,然后商品画像也有价格段的标签,比如说用户偏好的是 30-50 人民币的连衣裙,然后这个商品是连衣裙并且正好是在 30-50 人民币的,所以可能相对其它价格段的商品而言,在这一维上更合理;接着再结合其它维度的商品和用户标签的 match 就可以构建更多的匹配维度。


而偏后端一些的维度,商品画像也可以带来非常多的帮助,可以去驱动后端的供应链。通过商品画像的历史情况(近期曝光、点击、订单、转化等),可以去做销量预估,进行备货、采购、越库、生产物流等等环节的优化。



对于统一建模预测分析,首先如果有了人口属性细分,比如说一些性别,年龄段等等,就可以去明确用户是谁,他在平台上面买了什么,为什么买;有了购买行为细分以后,可以去明确市场机会,市场规模等关键信息;再次是产品需求的细分,提供根据差异化的竞争的产品规格和业务价值,可以去做更加差异化的竞争,不做海量的库存,而是更精准、成本更可控;最后是兴趣态度的细分,通过用户画像可以去做不同的渠道的策略,定价的策略,产品的策略,品牌策略;比如渠道策略,我们可以通过分渠道归因并捞取对应用户群体,并观察各个渠道群体的差异,比如类目偏好、价格段偏好等的差异,在投放过程中进行商品池和投放策略的优化。




总结一下就是商品和用户画像很重要,两者是相辅相成的,在整一个用户体验过程中非常重要。

03 如何构建商品/用户画像

——以用户画像为例——



那到底如何构建用户和商品画像呢,这里可以提一个概念叫侧写师,电影中经常有一些概念就是侧写师通过观察和收集犯罪现场的信息(数据收集),去想象作案人的心理和案发时的动作(预测),并最终为破案带来机会(实施),构建用户画像的方法论与其类似。



第一步是收集数据,图中方法比较多,各有优缺点,不过目前主流的还是通过用户静态数据结合海量的平台用户行为数据的方式。通过埋点,我们可以看到用户在我们平台上看了什么商品,点了什么商品买了什么商品,将这些数据串起来,可以作为入口去理解用户,更进一步,通过一些统计、概率知识进行建模,比如说用户细分、生命周期划分、流失用户研究等,做深层次的挖掘。接下来我们来解构用户画像。



主要是人口统计学属性、消费需求、购买能力、兴趣爱好、社交属性等。



用户画像的粒度简单来讲,比如年龄标签是 20-30 岁和 21 岁,这两个就是明显不同粒度的标签




再次就是可以从层级的角度来看,用户基本属性和行为标签为浅层用户画像,这些标签画像主要是收集就行,比如年龄,性别。第二层是稍作处理的汇总层,比如手机端大概什么时间活跃,经常购买的品类等。第三层是基于前 2 层可以做到营销的敏感度,社交关系,上网时间的预测;最后一个是更深层的,需要结合业务知识去做定制。比如保险领域的高中低价值、贷款需求程度,风险高低等。



网上找了一个金融领域的例子,比如根据活跃情况,可以区分活跃用户和流失用户,再根据时间窗口维度可以拆为 48 小时活跃和不活跃用户。简单的统计就可以为用户贴上各类的标签,比如过去 12 个月内累计订单超过 20 次为界限,可以划分为高低频用户等。不过多展开,可以自行阅读上图。




当然用户画像依赖的商品基础标签是必不可少的,比如用户服装偏好下有颜色偏好(白色),这个是通过用户历史的点击、加购、收藏等行为关联的商品所带标签的聚合,那其实底层商品的颜色标签是必不可少的。


接下来介绍的是一个构建方法论,但不是唯一方法论。



先从大维度来说,划分为动态和静态两类。比如说人口统计学的性别、年龄、地域、收入、生活习惯,是相对静态的,性别一般都不会变,年龄的话一年就涨一岁,然后地域的话也很少有大的变动,收入职业所处行业也不会有突然的变化,这些都可以划分到静态标签。而像用户访问设备、用户的 48 小时是否活跃、内容 &商品消费偏好等属于时常在发生变动的,这些可以划入动态特征。



静态和动态的划分,其实是根据某个维度来定的,或者是在某个时间窗口内的。静态画像一般是实时性弱更新慢;动态画像变化相对更快一些,可以再时效性、空间上有差异。




不同的行业,不同的业务,也会有不一样的构建目标和方式。在这个过程中,通过业务应用的要素分析,去驱动标签维度的扩展,然后通过标签维度的扩展。然后我又可以去驱动业务。







上述图片介绍了常用的偏好标签建模的思路,不做过多展开,有兴趣的小伙伴可以私信交流。



那系统化的标签生产如何来做呢,可以参考上图,上图元素和参考了很多美团的做法,由于篇幅限制,这里不过多展开,后续的分享可以专门来将构建的细节。




重点是结合业务,构建闭环,用数据来提升业务理解,通过业务理解来快速构建画像相关的数据体系。


04 商品/用户画像的应用

第四部分我们来介绍一些画像的应用。



第一个我们介绍一下通过用户画像来做与竞品对比分析,在大维度战略调整和选择的时候,可以有差异化市场定位。根据用户标签进行市场细分和群画像分析,输出分析报告;帮助企业理解用户的人群特征、人生阶段、消费偏好等;帮助企业分析和友商用户群的异同,优化市场定位和差异化产品策略。这部分数据有自己内部的数据,竞品数据可以通过第三方等间接获取。


比如今天 shein 作为跨境快时尚平台做得不错,如果同类型的平台是否可以考虑在年龄段标签上做差异化,比如他们切的是 18-35 岁的年轻女性,那是否可以考虑 35-50 岁的中年女性作为用户群,在运营过程中做调整,反而在利基点上有不错的收益。


另一个方向的思考是,如果我们在部分用户标签维度差异较大,如果我们就是希望拿下这部分用户,那就说明我们可能有做的不对的地方,通过数据去排查问题,比如是我们投放的过程中渠道选择带来这样的差异?货是不是有问题,价格过高?品类深度不够?认识到了这种差异,可以进一步深挖分析或者用户访谈,来对我们的产品给用户的心智营造做调整。



通过画像数据的对比,可以去确定一件事情,就是说我们的竞品到底是谁。真正的竞品突然在你眼前,画像跟你高度重合的那个,而不是我们假想的那个。如果你发现原来被认为是竞品的典型用户群体是在 30 到 50 岁之间,而你们的群体在 20 岁到 35 岁了,那至少在当前情况下,你们是弱竞争关系。



定位了不同的人群,并结合数据做一定划分后,我们也可以根据情况针对性做投放和媒体选取。在广告营销推广的时候,我们结合画像对用户进行划分,区分为大盘->成交->高价值用户,然后我们通过某些标签进行数据分析,如上图中的性别维度,我们对比中发现其实女性用户比例在高价值用户中与大盘用户中刚好反过来 。


那接下来就有几个动作,可以对投放渠道、商品进行分析,是引流的问题?还是货品上对于男性用户天然不高?商品运营有没有问题?如果不做调整,是否后期的投放渠道可以选取女性标签会更精准?



我们希望根据不同的媒体目标覆盖率高低进行一个预算的分配,在平台上人群通过标签进行拆分。上面的问题,我们拆分了性别,是否有其它的维度可以进一步拆分,比如通过用户上报的 APP 安装列表,在平台上高价值用户有多种购物类 APP 和金融类 APP 的安装,那在投放过程中可以根据渠道的差异进行筛选,或者在投放过程中选取对应的一些标签词进行尝试。



上面的例子是结合用户画像做不同渠道的选择,逐步测试和优化。而对于商品的定位调整,可以结合商品生命的周期,尝试做一些品类深度与宽度的运营。



对于不同生命周期内的用户,其实数据和画像的丰富度也会有差异,在精细化运营过程中可以根据情况做差异化的运营。这里再讲一个其他案例,在用户分析维度,初期会通过用户调研访谈进行初期的产品定位,在投放扩量过程中,结合用户站内的情况作出效率分析,新用户有什么特征?核心的用户属性是否有变化?前后一年内获客可能会有很大差异,这种差异时常去关注,可能会了解到产品的变化是否符合预期。




在精准营销领域的的一些尝试,可以参考上图。分析历史某个时间窗口内的用户,哪些方面是有特性的,比如年龄段,性别,地域,收入,偏好等,有了这样的分析,可以选择相应的人群投放。输出到媒体广告,做预算看效果,然后将效果数据回流,再去迭代,以提高进一步的准确率。通过某个特性找人,再去分析这些潜在用户,找到可以触达他们的渠道。




上图也跟前面介绍的有点类似,作用类似,就是通过筛选已有用户中的核心用户,结合这群用户的标签,进行投放标签的初步筛选。在成本需要控制的情况下,可以通过核心人群标签投放->强相关人群标签投放->一般用户标签投放,这里也需要结合不同人群经常交互的商品进行商品池选取。



在看一个金融领域的应用案例,根据职业、年龄、存款等进行筛选,并结合历史理财的偏好等进行基金推荐。







再讲一个概念就是 CRM,业界有很多探讨,其中也有一些问题点,如上图,后面分享我们对 CRM 可以专门展开。




有几个注意点也需要大家去注意的,其实我们有时候现有的用户不等于目标用户。在产品运营过程中,会发现平台上用户画像是这样的,但是结合战略以及竞品的一些情况,更大的去做差异化的竞争。重合的那部分是高价值用户,所以应该投入更多人力去做?结合用户画像去做更细粒度扩人群,是 A 人群还是 B 人群还是 C 人群?


然后第二点,构建什么样的用户画像,比如说用户是男性还是女性,她工资多少,喜欢什么样的商品。这些标签可能是没有意义的,如果要说有意义的地方是这些标签如何去影响决策,如何为用户带来更好的体验,带来更高的留存、复购。

05 回顾/总结

实践出真知,我们需要结合具体业务场景,做尝试。



我们要结合业务场景去分析,然后去不要单看画像,而是要做一些对比,通过前后对比,跟竞品的对比,跟频道内与大盘的对比等手段去分析,发现不足和优势,做纠正和调整。通过数据反馈形成数据的闭环,最终在产品的迭代过程中拿到更好的业务结果。总结一下,做画像要有目标要有数据,也不拘泥于技术细节,大胆的尝试,然后先粗粒度,后细粒度。


今天的分享就到这里,谢谢大家。


本文来自 DataFunTalk


原文链接


https://mp.weixin.qq.com/s?__biz=MzU1NTMyOTI4Mw==&mid=2247500642&idx=1&sn=15b22586962cee5c58bb58d898c9a465&chksm=fbd7710ecca0f818a5e1d96bf946ad545704cea6a4ce131b21d1679e4fd63b2ff07b840778be&scene=27#wechat_redirect


2020-06-02 10:005183

评论

发布
暂无评论
发现更多内容

恒源云(Gpushare)_JupyterLab/TensorBoard使用问题?技巧大放送4!

恒源云

人工智能 深度学习 PyTorch

RabbitMQ 实现延时队列(订单定时取消为例)

Ayue、

Rabbit MQ 4月月更

两步实现让antd与IDE和睦相处的处理案例

袋鼠云数栈

大数据 开源

恒源云(Gpushare)_如何安装包/pip加速等?技巧大放送3!

恒源云

安装 pip Ubuntu apt

Improvements of Job Scheduler and Query Execution on Flink OLAP

Apache Flink

大数据 flink 编程 实时计算 OLAP

Web 3.0的未来产业趋势

王强

Web 3.0

数栈在湖仓一体上的探索与实践

袋鼠云数栈

数据库 大数据 数据湖 湖仓一体

重塑企业数字化能力,端点科技重磅发布Erda2.0

科技热闻

Hoo虎符研究院|从多个方面了解公链Tezos和它的 Ithaca 2 升级

区块链前沿News

Hoo 虎符交易所 研究院 tezos

龙蜥开源Plugsched:首次实现 Linux kernel 调度器热升级 | 龙蜥技术

OpenAnolis小助手

Linux 内核 龙蜥社区 Plugsched

GaussDB(for Redis)助力《余烬风暴》实力上线,给您沉浸式魔幻体验

华为云数据库小助手

GaussDB GaussDB ( for Redis )

netty系列之:netty中的核心MessageToMessage编码器

程序那些事

Java Netty 程序那些事 4月月更

一个公式告诉你:如何提升团队的研发效率?

凌晞

技术管理 研发效率

Kubernetes官方java客户端之四:内部应用

程序员欣宸

Kubernetes client 4月月更

2022华为软件精英挑战赛复赛名单公布,快来看看都有哪些优秀赛队晋级

科技热闻

云效制品仓库 Packages,不限容量免费用

阿里云云效

云计算 maven 阿里云 npm 制品仓库

ffmpeg实现web在线转码

lo

4月月更

实时数仓建设

五分钟学大数据

实时计算 4月月更

Flink 实践教程-进阶(11):SQL 关联:Regular Join

腾讯云大数据

flink 流计算 流计算 Oceanus

北京市东城区赵海东副区长一行莅临博睿数据参观指导

博睿数据

Spring 完美导入 IDEA

阿Q说代码

spring IDEA 4月月更

腾讯云CDW-ClickHouse云原生实践

腾讯云大数据

Clickhouse 云数据仓库

Ribbon从入门到源码解析

李子捌

微服务 SpringCloud Ribbon

打通产销对接,构建新型数智化农副产品供应链

数商云

产业互联网 数字化

恒源云(Gpushare)_没有你想要的镜像?技巧大放送5!

恒源云

镜像仓库 显卡、gpu

阿里Maven仓库不限容量,免费用

阿里云云效

云计算 阿里云 npm Maven仓库 制品仓库

透过「人月神话」,看清软件开发问题

架构精进之路

软件开发 人月神话 4月日更 4月月更

百度信誉保障服务架构全解析

百度Geek说

后端

2022首场MASA技术团队黑客松大赛完美落幕!精彩集锦

MASA技术团队

C# .net 微软

衡石BI产品预置明道云数据连接器

明道云

Flink 实践教程-入门(10):Python作业的使用

腾讯云大数据

用户画像技术及方法论_大数据_DataFunTalk_InfoQ精选文章