写点什么

神策数据 CEO 桑文锋:精准采集数据,走向智能化分析

  • 2017-02-19
  • 本文字数:1453 字

    阅读完需:约 5 分钟

数据分析类的产品随着企业数据信息化的建设,势必会融合加强,慢慢演变成门户化,更人性化,且可视化技术将成为亮点,和交互式分析形成助推。虽然看起来很遥远,但现在有些数据分析服务已经开始意识到这些,并把数据分析管理进行门户化,拥有更强的模型支持能力,结合不同的应用场景需求,整合了搜索技术,极度简化信息的获取,融合工作流,满足业务流程式的分析需求,支持展现结果的二次分析。

不久前,神策数据 CEO 桑文锋在一次访谈中回顾,他在百度工作了八年,对数据很敏感。最初负责建立百度用户数据仓库基础,从 0 到 1 把各个业务线的数据统一到一起,建成统一的数据仓库,这其中就包括数据的采集、传输、建模、存储、差异分析、数据可视化等环节。通过对产品的性能分析,用数据所呈现的结果来对产品功能做调整和优化,一切都用数据说话。再到后来,自己创业做神策数据过程中,也秉承着“用数据帮助客户做最有价值的分析”的理念。

对于数据业务,简单将其分为三块:数据沉淀、挖掘和可视化,每一块分别对应不同的模式及产品或服务。数据挖掘业务又被细分为分析、理解及存储。桑文锋回忆建立百度用户数据仓库基础的最大心得,那就是对数据源的重视。所以他坚信,神策数据最有价值的分析结果,也离不开对精准数据源的采集。

数据沉淀就是数据采集,其途径有很多种,包括网络爬虫,用 Python 及 Go 等开发爬虫平台来获得信息;Wi-Fi 接入获得用户数据提供一些图像方面的 API,进行图片搜索及人脸搜索等。桑文锋说,神策的产品会记录多种数据源,不同终端(Web、App、H5、桌面软件)的用户行为,后端系统日志(Web server Log),业务数据(DB)等等。同时对前端、后端、第三方数据库、业务数据等全面采集,来保证数据源的准确和全面性,更好的进行数据分析,给业务带来新的增长价值。

基于上面所采集到的数据做统计分析、用户及品牌理解、用户画像等等,在分析能力上,支持多维事件分析、漏斗分析、留存分析、用户分群、行为轨迹分析和回访分析,不同分析模型帮助揭示数据背后的含义,了解产品的性能和优化方向。

为了将数据利用到极致,给客户带来更大的价值,神策数据在产品功能上下了很多功夫,具体概括为三大特点:

  1. 第一个特点就是提供私有化部署,将分析能力嵌入到客户的业务环境里,不去接触客户的数据,在一定程度上保证了客户的数据安全,而且对于金融领域的客户,这一点非常重要。
  2. 其次就是全端数据接入,随着数据分析越来越深入,越来越精细化,尤其是 O2O、金融类等客户,要考虑线上线下的数据结合,这样才能提供精准的分析。通过提供可视化埋点,SDK、工具导入等方式,帮助客户全方位细致的解决数据痛点。
  3. 最后一个特点是PaaS+SaaS 平台的结合。行业不同,需求各异,所以分析服务也要因人而异。PaaS 平台将底层数据和查询接口开放给客户,在此基础上进行二次开发,满足客户独有的分析需求和系统。

在商业化道路上,桑文锋坦诚的说这不是一个新市场,和同行不一样的地方的在于,神策数据提供灵活多维度交叉分析,任意维度进行交叉分析等精细化功能。在未来神策数据也将朝着产品智能化的方向前进。

我的原则和价值观

后来,桑文锋提到了在给客户提供服务之后,如果客户后期因为各种原因而没有坚持用完,神策数据也会主动将费用退还。宗旨就是希望神策数据的数据分析能力可以给客户带来价值,给双方带来价值。

有人问桑文锋,最在意的是什么?他说,最在意客户的满意度以及 NPS。其实他所在意的这些完全取决于产品的质量。只有质量过关,才能取得客户的信任,客户才会把神策数据推荐给其他用户,从而建立更广泛的合作。

2017-02-19 04:331130

评论

发布
暂无评论
发现更多内容

【设计模式】第三篇-单例模式

Brave

设计模式 单例模式 10月月更

官方线索|2021 长沙·中国 1024 程序员节

穿过生命散发芬芳

1024我在现场

Android开发中遇到加载有相同函数的so库时的问题

轻口味

10月月更

基于分布式认知工业互联网的汽车零部件质量溯源平台

CECBC

线程池处理批量接口请求实践

FunTester

线程池 性能测试 接口测试 测试框架 FunTester

在线中文繁简体转换工具

入门小站

工具

golang和java的性能对比及golang内存管理

hanaper

官方线索|2021 长沙·中国 1024 程序员节

耳东@Erdong

1024我在现场 10月月更

数字货币已被世界公认,中国市场即将爆发

CECBC

官方线索|CCF CED 中国工程师文化日

穿过生命散发芬芳

1024我在现场

和12岁小同志搞创客开发:如何驱动红外遥控器?

不脱发的程序猿

少儿编程 DIY 红外遥控器 创客开发

这篇博客和你唠唠 python 并发,滚雪球学python第四季,第16篇

梦想橡皮擦

10月月更

技术人在职场应该知道的沟通技巧

baiyutang

沟通模型 10月月更

Apache APISIX 社区周报 | 2021 10.1-10.14

API7.ai 技术团队

开源社区 API网关 APISIX 社区周报 Apache APISIX

从转移工具到移动急救室,5G救护车给行业带来了什么变化?

脑极体

我与消息队列的八年情缘

勇哥java实战分享

RocketMQ 消息队列 Activemq

官方线索|第二届1024国际智能投研开发者大会

穿过生命散发芬芳

1024我在现场

竞跑加速! 数字人民币场景全覆盖

CECBC

官方线索|【云+社区】程序员过节指南:如何玩转你的1024 ?

Regan Yue

1024 1024我在现场

不了解Zookeeper的童鞋看过来哦~

Regan Yue

zookeeper 10月月更

SQL注入进阶篇一php代码审计

网络安全学海

网络安全 信息安全 渗透测试 WEB安全 漏洞挖掘

官方线索|RTE2021 实时互联网大会

穿过生命散发芬芳

1024我在现场

Java常用容器笔记

风翱

java 10月月更

linux之sed使用技巧

入门小站

Linux

网站性能优化的实战指南

devpoint

html 性能优化 10月月更

【Flutter 专题】27 图解 ListView/GridView 混用时滑动冲突小尝试

阿策小和尚

Flutter 小菜 0 基础学习 Flutter Android 小菜鸟 10月月更

Apache APISIX 2.10.0 正式发布,带来第一个 LTS 版本!

API7.ai 技术团队

开源 API网关 APISIX Apache APISIX

官方线索|鸿蒙1024程序员节

轻口味

1024我在现场

官方线索|Gitee2021程序员节特别活动

穿过生命散发芬芳

1024我在现场

架构:微内核架构(Microkernel Architecture)二

程序员架构进阶

架构 规则引擎 微内核架构 OSGi 10月月更

Golang网络编程

CodeWithBuff

golang 网络编程 Go 语言 web socket

神策数据CEO桑文锋:精准采集数据,走向智能化分析_语言 & 开发_Lucien_InfoQ精选文章