写点什么

腾讯大数据产品总监洪桃李:移动数据化产品的发展之路

  • 2017-06-13
  • 本文字数:2997 字

    阅读完需:约 10 分钟

大数据时代,各类数据爆炸式增长,与此相关的数据化产品也层出不穷,甚至已经到了泛滥的境地。

2017 年,由 InfoQ 举办的 GMTC 全球移动技术大会上,腾讯移动分析 MTA 和移动推送(信鸽)为解决数据化产品泛滥问题带来了一套自己的解决方案。

InfoQ 记者在 GMTC 大会现场采访到了腾讯大数据产品总监洪桃李先生,请他从自己的角度为我们分析数据化产品的现状以及腾讯移动数据化产品的发展之路。

诉求

在数据化产品泛滥的今天,不少开发者都有这样的疑问:现阶段应该在哪些方面来关注数据的核心诉求?
洪桃李根据自己目前接触过的开发者与客户,总结出目前阶段比较重要的三点核心诉求:

一、要有灵活的数据采集

因为所有的大数据和 AI 的基础都需要有准确的有效的数据,业务变化非常快,所以数据需求非常灵活。

如果想要采集什么数据,就要修改代码里面的埋点,然后测试发布,之后应用商店的审核,这可能几个星期过去了,不能满足业务随需应变的需求。

因此腾讯移动分析 MTA 今年在业界第一个推出了可视化埋点的技术,用户可以在后端在 web 上给 App 进行可视化的埋点,让产品运营人员不需要依赖技术人员就可以随时的去修改埋点。

把手机连接到 MTA 的后台,之后在后台就能进行可视化配置,再经过测试,下发到所有的手机,立刻生效,不需要去通过应用商店发版。

这样灵活的数据采集能力,在洪桃李看来对开发者是一个核心的亮点,因为基本的分析、基本的采集大家都会做,那这个时候灵活的数据采集就有非常大的亮点。

二、要有强大的计算能力

因为大数据的分析跟计算是非常消耗资源的。就这一点来说,腾讯 MTA 每天有 4000 亿的数据上报量,同时拥有几千台机器的集群,这样的资源共享是一般的产品或者是中小企业没办法具备的,因为任何一个公司现在数据量都非常大,只要想采集的点足够多,那数据就会就膨胀得非常夸张。

三、精准的分析和挖掘的能力

有了大量数据之后就要考虑这些问题:怎样挖掘出有价值的内容、怎样分析这个用户的行为特征、怎样知道这个用户更精准画像、怎样给用户打上标签、怎样用户进行分群、怎样给他做精准化的营销和用户触达,这些问题都是数据应用层面的。作为腾讯大数据平台,恰好在这方面积累非常深厚,在公司内部的推荐、数字化营销、广告等方面都有应用。

洪桃李认为:灵活的采集、强大的计算能力和精准的分析挖掘是开发者非常需要的能力。

价值

腾讯为开发者带来了 MTA 和推送(信鸽),那么它们对于开发者的价值何在呢?

洪桃李的回答是:简单、共赢、精准。

简单快速应用

做采集、上报、分析、挖掘这种工作开发工作量非常大,而腾讯 MTA 只要集成 SDK 就能够非常容易地使用。包括 Crash,能够立刻实现 Crash 的上报还原,这样强大的计算能力跟强大的报表展现能力,对开发者来说,能够立刻免费使用腾讯完善可靠的分析和推送的能力。

共享强大终端连接能力

另一个对开发者提供的能力就是:就腾讯移动推送(信鸽)来说,它有共享终端连接的能力,提高设备的推送抵达率,同时提供大客户后台专用通道,保证推送速度。

如今在安卓上进行消息推送,会受制于终端,App 不一定活跃,连接不一定能够送达,所以消息抵达率通常比较低。但腾讯移动推送信鸽,它是由各个 App 共享,可以共享一个后台连接,这样只要有一个 App 活跃,信鸽的连接就是活的,那么其他 App 也能借用这个连接把消息及时送达。

关于腾讯推送信鸽的使用规模,洪桃李说:“有上万的 App 在使用腾讯信鸽的推送服务,腾讯内部也有很多,比如王者荣耀等一些腾讯游戏;腾讯之外也有上万的 App 用户,所以如果使用腾讯的信鸽就相当于加入我们这个联盟,大家聚在一起,各个 App 都更加收益。”

腾讯信鸽推送的实力也受到了一些大客户的认可,洪桃李以艺龙为例,最近已经切换了另一个友商的推送工具,使用腾讯信鸽推送,在换掉推送工具之后,它的消息抵达率立刻提升了六个百分点。“这个非常好的情况,也是我们推送实力的一个实例证明。”洪桃李说。

除了终端连接能力之外,腾讯信鸽推送也为客户提供了用户分群、用户标签和精准推送,并实现实时效果统计。

分群和标签,这是为开发者提供的第三种数字服务能力。基于腾讯数据平台多年的建设,已经可以做到了解用户,深入挖掘用户标签。这种能力运用在分析跟推送中,可以让用户收到精准的自己需要和喜欢的推送。

安全

不论腾讯内部还是外部,上万的开发者都在使用腾讯的移动数据分析以及推送系统。如此庞大的数据,不得不让人在安全方面担忧。

洪桃李从四个层面为我们分析了腾讯大数据平台的安全防护

采集

洪桃李说,腾讯大数据平台对业界,无论是中小型开发者还是大型企业,输出的是数据处理的能力,在此过程中,最基础的原则就是,高度重视用户的数据安全。所以用户在上行数据的时候,首先要进行把关,对用户上行的数据要做到强硬,这是在数据采集阶段要做的事情。

存储

存储上会采用多副本的方式进行存储,还有一些回收站的机制和延迟删除的技术等等来保护用户的第一手的数据,避免出现操作上误删除的一些情况。

使用

腾讯移动分析和移动推送,用户创造出来的数据跟腾讯自有的业务数据在物理上是分隔的,不会让腾讯自己的数据,对于用户的数据产生污染。

系统防御

腾讯大数据平台会背靠整个公司对外提供的基础安全能力,据洪桃李介绍:腾讯内部有“宙斯”、有“门神”、有“TGW”这样统一的门户网关,通过这些公共安全服务来帮助移动开发者和企业;在数据上面,设置一道又一道的安全关卡来守护用户的安全。

洪桃李补充道:“另外,腾讯内部跟外部对数据安全这块都有严格的权限管理系统,有严格的内部审批的系统,还有内部的审计跟外部的审计。因此,开发者们可以放心信任我们的数据服务安全性。”

探索

腾讯大数据平台已经存在了九年,从九年前就已经在进行大数据的研究确实是很有前瞻性的一种表现。那么在九年的时间里,腾讯在数据产品化方面进行着怎样的探索?

洪桃李说:“早几年,我们主要是在腾讯内部使用,支撑了腾讯的社交、媒体、游戏以及广告等业务。现在我们把腾讯的这种能力进行输出,输出我们的是平台跟能力,把我们的经验与教训输出给开发者,为开发者提供更多服务。”

这些服务包括在移动开发领域助力 App 开发者,为 App 提供分析挖掘的能力,启用用户标签进行精准推送的能力、搭建稳定的推送通道,乃至于对 H5 开发者提供分析的能力、帮小程序的开发者也提供深入分析的能力。

除了移动开发方面,腾讯还有其他一些数据产品,比如对传统企业提供大数据处理套件,例如三一重工,企业能够通过腾讯的服务采集各类终端设备的信息,上传到数据处理平台,使用腾讯提供的挖掘模型进行深入解析。同时腾讯大数据还持续为更多的中小企业提供这类大数据的挖掘处理的能力。这些大数据处理的产品也都在腾讯云上公开,为所有的客户提供服务。

除了以上内容,据洪桃李介绍,腾讯大数据还有属于自己的数字营销,把数据服务的能力打包,作为营销工具在腾讯云上对外输出,比如说平安等客户,就在使用精准推荐,推荐给营销人员。还比机器学习的平台,也由大数据平台推出来,并在腾讯云上提供对外服务。

最后,洪桃李说:“我们一揽子的大数据产品现在已经越来越丰富了,移动开发到传统企业,然后到机器学习,到精准营销,这一揽子的服务产品,现在正在逐渐把我们的能力释放出来。”

专家介绍:

洪桃李,腾讯 P4 专家 / 产品中心总监,10 年以上技术研发、项目、产品管理工作,在数据产品、支付金融、企业大数据等领域积累了丰富经验。兼任香港城市大学资讯系顾问委员会委员。

2017-06-13 19:001882
用户头像
陈思 InfoQ编辑

发布了 576 篇内容, 共 280.0 次阅读, 收获喜欢 1301 次。

关注

评论

发布
暂无评论
发现更多内容

数字化“翻译官”

boshi

数字化 七日更

Lex Fridman: How to learn and master a new skill 简评

teoking

Elasticsearch Document 写入原理

escray

elastic 28天写作 死磕Elasticsearch 60天通过Elastic认证考试

打卡第一次

容光

办公自动化

什么样的技术能进入一线大厂?这份阿里、百度、腾讯等 20家Java岗招聘要求梳理报告,会给你答案;

Java架构师迁哥

优雅编程 | Javascript闭包的4种高级用法

devpoint

闭包 防抖 节流 闭包要点

飞行汽车到底能不能普及?

石云升

思维方式 科技革命 28天写作 3月日更

Oracle中我们什么时候需要用到定时任务?

xiezhr

oracle 定时任务 存储过程

跳表

一个大红包

3月日更

一名MindSpore新手的爬坑记录~~

依旧廖凯

28天写作 3月日更

Python DataTime 日期处理

HoneyMoose

原来我还有网络天赋

叫练

网络 交换机

算法攻关 - 重上到下打印二叉树 (O(n))_offer32

小诚信驿站

刘晓成 小诚信驿站 28天写作 算法攻关 从上到下打印二叉树

读书笔记:我的安全世界观

架构精进之路

安全 #读书 3月日更

优化自动化测试流程,使用 flask 开发一个 toy jenkins工具

和牛

Python 软件测试

(28DW-S8-Day21) 《流程型组织》学习笔记:「客户第一」还是「老板第一」

mtfelix

28天写作 流程型组织

十四五重头戏的工业互联网,为什么需要IP化先行

脑极体

互联网信贷风险与大数据 存量管理

张老蔫

28天写作

LeetCode题解:91. 解码方法,动态规划,JavaScript,详细注释

Lee Chen

算法 大前端 LeetCode

网易游戏基于 Flink 的流式 ETL 建设

Apache Flink

flink

「Linux」网络配置大揭秘

我是程序员小贱

3月日更

​Web攻击怎么办?安全防护有方案

安全

啥?用了并行流还更慢了

L

Java

高质量、高并发的实时通信架构设计与探索

融云 RongCloud

架构 通信

浅谈:国内低代码开发平台能搭建哪些企业管理系统?

优秀

低代码开发平台

粉丝福利 | 秒 get 支付宝同款扫码组件

蚂蚁集团移动开发平台 mPaaS

支付宝 二维码 mPaaS 扫码 QRCODE

基于SparkMLlib智能课堂教学评价系统的设计与实现(一)

大数据技术指南

大数据 spark 智能时代 28天写作 3月日更

Wireshark数据包分析学习笔记Day9

穿过生命散发芬芳

Wireshark 数据包分析 3月日更

San CLI 的实现原理

百度Geek说

cli service san command

CodeHub#4 前情预告|H5 容器在技术实践中的应用

蚂蚁集团移动开发平台 mPaaS

html5 移动开发 codehub 教育科技

虚拟路由器冗余协议 VRRP 详解

腾讯大数据产品总监洪桃李:移动数据化产品的发展之路_移动_陈思_InfoQ精选文章