写点什么

腾讯大数据产品总监洪桃李:移动数据化产品的发展之路

  • 2017-06-13
  • 本文字数:2997 字

    阅读完需:约 10 分钟

大数据时代,各类数据爆炸式增长,与此相关的数据化产品也层出不穷,甚至已经到了泛滥的境地。

2017 年,由 InfoQ 举办的 GMTC 全球移动技术大会上,腾讯移动分析 MTA 和移动推送(信鸽)为解决数据化产品泛滥问题带来了一套自己的解决方案。

InfoQ 记者在 GMTC 大会现场采访到了腾讯大数据产品总监洪桃李先生,请他从自己的角度为我们分析数据化产品的现状以及腾讯移动数据化产品的发展之路。

诉求

在数据化产品泛滥的今天,不少开发者都有这样的疑问:现阶段应该在哪些方面来关注数据的核心诉求?
洪桃李根据自己目前接触过的开发者与客户,总结出目前阶段比较重要的三点核心诉求:

一、要有灵活的数据采集

因为所有的大数据和 AI 的基础都需要有准确的有效的数据,业务变化非常快,所以数据需求非常灵活。

如果想要采集什么数据,就要修改代码里面的埋点,然后测试发布,之后应用商店的审核,这可能几个星期过去了,不能满足业务随需应变的需求。

因此腾讯移动分析 MTA 今年在业界第一个推出了可视化埋点的技术,用户可以在后端在 web 上给 App 进行可视化的埋点,让产品运营人员不需要依赖技术人员就可以随时的去修改埋点。

把手机连接到 MTA 的后台,之后在后台就能进行可视化配置,再经过测试,下发到所有的手机,立刻生效,不需要去通过应用商店发版。

这样灵活的数据采集能力,在洪桃李看来对开发者是一个核心的亮点,因为基本的分析、基本的采集大家都会做,那这个时候灵活的数据采集就有非常大的亮点。

二、要有强大的计算能力

因为大数据的分析跟计算是非常消耗资源的。就这一点来说,腾讯 MTA 每天有 4000 亿的数据上报量,同时拥有几千台机器的集群,这样的资源共享是一般的产品或者是中小企业没办法具备的,因为任何一个公司现在数据量都非常大,只要想采集的点足够多,那数据就会就膨胀得非常夸张。

三、精准的分析和挖掘的能力

有了大量数据之后就要考虑这些问题:怎样挖掘出有价值的内容、怎样分析这个用户的行为特征、怎样知道这个用户更精准画像、怎样给用户打上标签、怎样用户进行分群、怎样给他做精准化的营销和用户触达,这些问题都是数据应用层面的。作为腾讯大数据平台,恰好在这方面积累非常深厚,在公司内部的推荐、数字化营销、广告等方面都有应用。

洪桃李认为:灵活的采集、强大的计算能力和精准的分析挖掘是开发者非常需要的能力。

价值

腾讯为开发者带来了 MTA 和推送(信鸽),那么它们对于开发者的价值何在呢?

洪桃李的回答是:简单、共赢、精准。

简单快速应用

做采集、上报、分析、挖掘这种工作开发工作量非常大,而腾讯 MTA 只要集成 SDK 就能够非常容易地使用。包括 Crash,能够立刻实现 Crash 的上报还原,这样强大的计算能力跟强大的报表展现能力,对开发者来说,能够立刻免费使用腾讯完善可靠的分析和推送的能力。

共享强大终端连接能力

另一个对开发者提供的能力就是:就腾讯移动推送(信鸽)来说,它有共享终端连接的能力,提高设备的推送抵达率,同时提供大客户后台专用通道,保证推送速度。

如今在安卓上进行消息推送,会受制于终端,App 不一定活跃,连接不一定能够送达,所以消息抵达率通常比较低。但腾讯移动推送信鸽,它是由各个 App 共享,可以共享一个后台连接,这样只要有一个 App 活跃,信鸽的连接就是活的,那么其他 App 也能借用这个连接把消息及时送达。

关于腾讯推送信鸽的使用规模,洪桃李说:“有上万的 App 在使用腾讯信鸽的推送服务,腾讯内部也有很多,比如王者荣耀等一些腾讯游戏;腾讯之外也有上万的 App 用户,所以如果使用腾讯的信鸽就相当于加入我们这个联盟,大家聚在一起,各个 App 都更加收益。”

腾讯信鸽推送的实力也受到了一些大客户的认可,洪桃李以艺龙为例,最近已经切换了另一个友商的推送工具,使用腾讯信鸽推送,在换掉推送工具之后,它的消息抵达率立刻提升了六个百分点。“这个非常好的情况,也是我们推送实力的一个实例证明。”洪桃李说。

除了终端连接能力之外,腾讯信鸽推送也为客户提供了用户分群、用户标签和精准推送,并实现实时效果统计。

分群和标签,这是为开发者提供的第三种数字服务能力。基于腾讯数据平台多年的建设,已经可以做到了解用户,深入挖掘用户标签。这种能力运用在分析跟推送中,可以让用户收到精准的自己需要和喜欢的推送。

安全

不论腾讯内部还是外部,上万的开发者都在使用腾讯的移动数据分析以及推送系统。如此庞大的数据,不得不让人在安全方面担忧。

洪桃李从四个层面为我们分析了腾讯大数据平台的安全防护

采集

洪桃李说,腾讯大数据平台对业界,无论是中小型开发者还是大型企业,输出的是数据处理的能力,在此过程中,最基础的原则就是,高度重视用户的数据安全。所以用户在上行数据的时候,首先要进行把关,对用户上行的数据要做到强硬,这是在数据采集阶段要做的事情。

存储

存储上会采用多副本的方式进行存储,还有一些回收站的机制和延迟删除的技术等等来保护用户的第一手的数据,避免出现操作上误删除的一些情况。

使用

腾讯移动分析和移动推送,用户创造出来的数据跟腾讯自有的业务数据在物理上是分隔的,不会让腾讯自己的数据,对于用户的数据产生污染。

系统防御

腾讯大数据平台会背靠整个公司对外提供的基础安全能力,据洪桃李介绍:腾讯内部有“宙斯”、有“门神”、有“TGW”这样统一的门户网关,通过这些公共安全服务来帮助移动开发者和企业;在数据上面,设置一道又一道的安全关卡来守护用户的安全。

洪桃李补充道:“另外,腾讯内部跟外部对数据安全这块都有严格的权限管理系统,有严格的内部审批的系统,还有内部的审计跟外部的审计。因此,开发者们可以放心信任我们的数据服务安全性。”

探索

腾讯大数据平台已经存在了九年,从九年前就已经在进行大数据的研究确实是很有前瞻性的一种表现。那么在九年的时间里,腾讯在数据产品化方面进行着怎样的探索?

洪桃李说:“早几年,我们主要是在腾讯内部使用,支撑了腾讯的社交、媒体、游戏以及广告等业务。现在我们把腾讯的这种能力进行输出,输出我们的是平台跟能力,把我们的经验与教训输出给开发者,为开发者提供更多服务。”

这些服务包括在移动开发领域助力 App 开发者,为 App 提供分析挖掘的能力,启用用户标签进行精准推送的能力、搭建稳定的推送通道,乃至于对 H5 开发者提供分析的能力、帮小程序的开发者也提供深入分析的能力。

除了移动开发方面,腾讯还有其他一些数据产品,比如对传统企业提供大数据处理套件,例如三一重工,企业能够通过腾讯的服务采集各类终端设备的信息,上传到数据处理平台,使用腾讯提供的挖掘模型进行深入解析。同时腾讯大数据还持续为更多的中小企业提供这类大数据的挖掘处理的能力。这些大数据处理的产品也都在腾讯云上公开,为所有的客户提供服务。

除了以上内容,据洪桃李介绍,腾讯大数据还有属于自己的数字营销,把数据服务的能力打包,作为营销工具在腾讯云上对外输出,比如说平安等客户,就在使用精准推荐,推荐给营销人员。还比机器学习的平台,也由大数据平台推出来,并在腾讯云上提供对外服务。

最后,洪桃李说:“我们一揽子的大数据产品现在已经越来越丰富了,移动开发到传统企业,然后到机器学习,到精准营销,这一揽子的服务产品,现在正在逐渐把我们的能力释放出来。”

专家介绍:

洪桃李,腾讯 P4 专家 / 产品中心总监,10 年以上技术研发、项目、产品管理工作,在数据产品、支付金融、企业大数据等领域积累了丰富经验。兼任香港城市大学资讯系顾问委员会委员。

2017-06-13 19:001923
用户头像
陈思 InfoQ编辑

发布了 576 篇内容, 共 281.9 次阅读, 收获喜欢 1302 次。

关注

评论

发布
暂无评论
发现更多内容

并发问题的源头

Java旅程

Java 并发编程

一个很多人不知道的SpringBoot小技能!!

冰河

Java 分布式 微服务 springboot 服务化

C++17 中的条件变量

hedzr

c++ 算法 并发编程 元编程 policy

Vue进阶(五十八):ES字符串操作:遍历、比较、截取、补全...

No Silver Bullet

Vue ES 字符串 7月日更

Rust从0到1-面向对象编程-设计模式

rust 设计模式 面向对象编程 状态模式 state pattern

价值连城 知名深度强化学习Pieter Abbeel的采访 John 易筋 ARTS 打卡 Week 56

John(易筋)

ARTS 打卡计划

网络协议:TCP可靠传输原理

赖猫

c++ TCP 后端 网络协议

iOS15上线图片翻译功能,能取代专业翻译软件吗?

脑极体

和12岁小同志搞创客开发:如何使用继电器?

不脱发的程序猿

DIY 嵌入式 创客开发 继电器

王者荣耀商城异地多活架构设计

chenmin

Discourse 的标签(Tag)只能是小写的原因

HoneyMoose

阿里培训笔记惨遭泄露,Spring+SpringBoot+SpringCloud

Java架构师迁哥

后疫情时代,共享育儿也能变成一门好生意?!

脑极体

Linux之date命令

入门小站

Linux

Vue进阶(五十七):ES数组操作:find(), findIndex(), filter(), forEach(), some(), every(), map(), reduce()

No Silver Bullet

Vue ES 7月日更 数组操作

开跑!Mobileye自动驾驶汽车路测落地纽约

E科讯

携手生态伙伴亮相InfoComm,英特尔赋能智能协作办公

E科讯

巧用 readonly与 const

喵叔

7月日更

密码学系列之:Merkle–Damgård结构和长度延展攻击

程序那些事

加密解密 密码学 程序那些事

maven是什么

卢卡多多

7月日更

登陆框有多危险,可能你还不知道。。。

网络安全学海

黑客 网络安全 信息安全 渗透测试· 漏洞分析

week 9 作业

Geek_2e7dd7

架构实战营

在线时间加减计算器

入门小站

工具

ZooKeeper 分布式锁 Curator 源码 03:可重入锁并发加锁

程序员小航

Java zookeeper 源码 分布式锁 zookeeper分布式锁

23w字!Github一夜爆火被各大厂要求直接下架的Java面试题库也太强了

Java架构师迁哥

结构化流-Structured Streaming(八-中)

Databri_AI

spark 结构化思维 Kafk

手写Spring框架,是时候撸个AOP与Bean生命周期融合了!

小傅哥

Java spring 小傅哥 aop 代理

linux c解决多个第三方so动态库包含不同版本openssl造成的符号冲突

奔着腾讯去

openssl so动态库 动态链接库

网络传输协议kcp原理解析

赖猫

TCP 网络协议

没有电和网络的时候如何支付一瓶水?

escray

学习 极客时间 朱赟的技术管理课 7月日更

Python OpenCV 图像的 最近邻插值 与 双线性插值算法 优化迭代

梦想橡皮擦

Python 7月日更

腾讯大数据产品总监洪桃李:移动数据化产品的发展之路_移动_陈思_InfoQ精选文章