快手、孩子王、华为等专家分享大模型在电商运营、母婴消费、翻译等行业场景的实际应用 了解详情
写点什么

你真的懂用户画像吗?

  • 2019-03-05
  • 本文字数:2314 字

    阅读完需:约 8 分钟

你真的懂用户画像吗?

在移动互联网时代,精细化运营成为企业重要的竞争力,此时,“用户画像”的概念也应运而生。用户画像是指,在大数据时代,我们通过对海量数字信息进行清洗、聚类、分析,从而将数据抽象成标签,利用这些标签将用户形象具体化,从而为用户提供有针对性的服务。在下文中,我们将以个推用户画像产品为例,为你详解“用户画像”的技术特点和使用价值。


个推用户画像产品依托个推多年积累的海量数据及强大的数据分析能力,可为 APP 开发者提供丰富的用户画像数据以及实时的场景识别能力,进而帮助客户了解用户信息,从而助力移动 APP 目标用户精准筛选、个性化推送消息和应用更新下载等。


用户画像的形成需要经历四个过程,主要包括数据收集、数据清洗、数据建模分析、数据产出。其中,数据清洗和数据建模统称数据处理,在经过数据处理之后,个推凭借多年积累的大数据能力,以独特的冷、热、温数据维度分析进行数据产出形成用户画像。

一、用户画像用了哪些技术?

在数据处理阶段,个推用户画像产品的大数据计算架构采用了 Kafka 分布式发布订阅消息系统,这一系统具有高吞吐量、高稳定性的特点。数据清洗可利用 HADOOP、SPARK 实现设备唯一性识别、行为数据的清洗等,从而去除冗余数据。这一过程支持交互计算和多种复杂算法,同时,它还支持数据实时/离线计算。



在数据建模的过程中,主要用了机器学习中的聚类(无监督学习)和深度学习技术,这能让模型对用户行为数据主动学习,进行行为判断,由此产出用户标签。



之后,数据的产出会形成冷数据画像、温数据回溯、热数据场景和定制化标签四种画像。


冷数据画像,是指基于大数据分析出用户的属性,改变概率较小的数据,如用户的年龄段、性别等。


“温数据”则可以回溯用户近期活跃的线上和线下场景,具有一定的时效性。


“热数据”是指用户当下的场景及实时的用户特征,帮助 APP 运营者抓住稍纵即逝的营销机会。


定制化标签是将个推数据与第三方数据结合起来,共同建模得出具有价值的特征标签。总的来说,个推用户画像产品不仅能产出通用的标签维度,也有定制化标签的输出能力。


二、如何构建用户画像?

“用户画像”的构建需要技术和业务人员的共同参与,以避免形式化的用户画像,具体做法可参考个推构建用户画像的流程:


(1)标签体系设计。开发者需要先了解自身的数据,确定需要设计的标签形式。


(2)基础数据收集、多数据源数据融合。在建设用户画像时,个推用户画像产品会整合个推以及该 APP 自身的数据。


(3)实现用户统一标识。多数情况下,APP 的众多用户分布于不同的账号体系中,个推会将其统一标识,帮助 APP 打通账号,实现信息快速共享。


(4)用户画像特征层构建,即将每一个数据进行特征化。


(5)画像标签规则+算法建模,两者缺一不可。在实际的应用中,算法难以解决的问题,利用简单的规则也可以达到很好的效果。


(6)利用算法对所有用户打标签


(7)画像质量监控。在实际的应用中,用户画像会产生一定的波动,为了解决这个问题,个推建设了相应的监控系统,对画像的质量进行监控。


总之,个推用户画像构建的整体流程,可以概况为三个部分:


第一,基础数据处理。基础数据包括用户设备信息、用户的线上 APP 偏好以及线下场景数据等。


第二,画像中间数据处理。处理结果包括线上 APP 偏好特征和线下场景特征等。


第三,画像信息表。表中应有四种信息:设备基础属性;用户基础画像,包括用户的性别、年龄段、相关消费水平等;用户兴趣画像,即用户更有兴趣的方向,比如用户更偏好拼团还是海淘;用户其它画像等。


在个推用户画像构建的过程中,机器学习占据了较为重要的位置。机器学习主要应用在海量设备数据采集、数据清洗、数据存储的过程。

三、用户画像能做什么?

用户画像常用在电商、新闻资讯等 APP,帮助 APP 打造内容精准推荐系统,实现千人千面运营。

基于用户特征的个性化推荐

APP 的运营者通过个推用户画像提供的性别、年龄段、兴趣爱好等标签,分别展示不同的内容给用户,以达到精准化运营。


基于用户特征指导内容推荐

基于用户特征指导内容的推荐是指找到与目标相似的用户群,利用该用户群的行为特征对目标用户进行内容推荐,具体过程如下图:



在这里,我们需要解释一下其中所涉及到的相似性建模技术。相似性建模可类比于聚类建模,它是无监督学习中的一种,它指的是寻找数据中的特征,把具有相同特征的数据聚集在一组,赋予这些聚集在一起的数据相同的特征标签,从而给这些具有这些特性的用户推送相同的内容。



这种推荐方式的优点是,它的自有特征是经过 APP 长期积淀而来,颗粒度更细,适用性更强,对用户的认识更全面,效果能持续提升,而且它还能针对 APP 所处行业与自身需求,量身定制匹配算法,让推荐更精准。


此外,如上文所言,个推用户画像能够结合第三方数据做定制化建模,通过双方共同建模得出显著价值和特征标签,依据不同标签向用户推送不同的内容。这样不仅能保证推送的内容更精准,覆盖面也更广泛,而且标签增补的方式,也可以很大程度上提升流量价值。

四、开发者如何接入?

个推用户画像 SDK 的接入主要有两个方式:


  • SDK 集成:客户端集成个推用户画像 SDK,进行初始化 SDK 后,返回给客户一个 ID 即 GIUID(唯一身份标识), 此 ID 需要由客户端提交到客户服务器,然后服务器通过 API 接口传入 GIUID 进行查询用户画像标签数据。



  • API 接口调用:客户将应用名称、包名及服务端出口 IP 提供后,返回 APP ID 等相关信息。客户根据《个推用户画像数据服务接口文档》及《用户画像编码表》集成测试后方可调用 API 接口查询画像信息。



具体的集成文档参见以下链接:



2019-03-05 11:059408
用户头像

发布了 83 篇内容, 共 48.0 次阅读, 收获喜欢 187 次。

关注

评论

发布
暂无评论
发现更多内容

大型企业数智化转型,工程化体系建设至关重要

用友BIP

数智底座

【从零开始学爬虫】采集全国各行业经销商网点数据

前嗅大数据

大数据 爬虫 数据采集 爬虫教程 爬虫入门

软件测试/测试开发丨Python 装饰器 学习笔记

测试人

Python 程序员 软件测试 装饰器 测试开发

Java基础!Java反射机制!!

java易二三

Java 编程 互联网 计算机

程序员必读十大电子书

六月的雨在InfoQ

电子书 Java工程师成神之路

Cloud Kernel SIG 月度动态:支持龙芯和申威架构,合入两个内存新特性

OpenAnolis小助手

开源 架构 内存 内核 龙蜥sig

一文帮你全面认识方天视窗引擎

openEuler

Linux 开源 操作系统 openEuler 视窗引擎

如果你在选型低代码平台,可以从这5个角度去分析抉择

互联网工科生

源码 低代码 系统集成 私有化部署

四步法建立企业内部人才市场

用友BIP

人力资源

WIFI7 QCN9274 -WIFI6E QCN9074 chip difference MU-MIMO+TWT technology

wifi6-yiyi

wifi6 WiFi7

九州八荒录H5游戏详细图文架设教程

echeverra

游戏开发

一键登录教你如何解决APP通讯诈骗问题

MobTech袤博科技

App

灵动AI推出业内首个工业级“AI商品图”生成工具 并获小米联合创始人黎万强天使投资

TE智库

当流计算邂逅数据湖:Paimon 的前生今世

Apache Flink

大数据 flink 实时计算

给世界一个更好的选择,“龙蜥+超级探访”首期嘉宾预告片震撼来袭!

OpenAnolis小助手

开源 操作系统 龙蜥社区 统信软件 超级探访

2 种方式查找极狐GitLab 容器镜像 Tag,几分钟快速构建私有化部署实例

极狐GitLab

DevOps gitlab Helm 容器镜像 Omnibus package

MySQL 的解析器以及 MySQL8.0 做出的改进 | StoneDB技术分享 #2

StoneDB

MySQL 数据库 HTAP StoneDB

金山云与平凯星辰达成全面战略合作 技术创新模式助力企业数字化转型

PingCAP

金山云 数字化 TiDB pingCAP 平凯星辰

香港VPS大揭秘:轻松打造超高流量网站

一只扑棱蛾子

VPS 香港VPS

git撤销某一次commit提交

树上有只程序猿

git

QQ开展外挂专项整治,守护用户社交环境安全

Geek_2d6073

你了解Vue3组合式API吗?

OpenTiny社区

Vue 前端框架 开源组件库

鸿煦科技刘敏:小程序云开发降本增效实践之路

TRaaS

小程序 支付宝 开发

设计原则 — KISS & YAGNI

Lemoon Can

设计原则 KISS YAGNI

门槛一降再降,易用性大幅提升!Milvus 2.2.12 持续升级中

Zilliz

Milvus Zilliz 向量数据库

@开源技术爱好者,龙蜥邀您一起玩转系统运维 MeetUp

OpenAnolis小助手

Linux 系统运维 ebpf Meetup 龙蜥社区

我的 Obsidian 笔记跨设备同步方案

专注前端开发

工具 笔记 Obsidian

提高代码质量!详解在Gradle项目中使用PMD的正确姿势

树上有只程序猿

Gradle

Java构建树结构的公共方法

高端章鱼哥

java基础 树结构

【福利活动】深度体验OpenHarmony对接华为云IoT

OpenHarmony开发者

OpenHarmony

你真的懂用户画像吗?_移动_覃云_InfoQ精选文章