QCon 演讲火热征集中,快来分享技术实践与洞见! 了解详情
写点什么

神策数据 CEO 桑文锋:精准采集数据,走向智能化分析

  • 2017-02-19
  • 本文字数:1453 字

    阅读完需:约 5 分钟

数据分析类的产品随着企业数据信息化的建设,势必会融合加强,慢慢演变成门户化,更人性化,且可视化技术将成为亮点,和交互式分析形成助推。虽然看起来很遥远,但现在有些数据分析服务已经开始意识到这些,并把数据分析管理进行门户化,拥有更强的模型支持能力,结合不同的应用场景需求,整合了搜索技术,极度简化信息的获取,融合工作流,满足业务流程式的分析需求,支持展现结果的二次分析。

不久前,神策数据 CEO 桑文锋在一次访谈中回顾,他在百度工作了八年,对数据很敏感。最初负责建立百度用户数据仓库基础,从 0 到 1 把各个业务线的数据统一到一起,建成统一的数据仓库,这其中就包括数据的采集、传输、建模、存储、差异分析、数据可视化等环节。通过对产品的性能分析,用数据所呈现的结果来对产品功能做调整和优化,一切都用数据说话。再到后来,自己创业做神策数据过程中,也秉承着“用数据帮助客户做最有价值的分析”的理念。

对于数据业务,简单将其分为三块:数据沉淀、挖掘和可视化,每一块分别对应不同的模式及产品或服务。数据挖掘业务又被细分为分析、理解及存储。桑文锋回忆建立百度用户数据仓库基础的最大心得,那就是对数据源的重视。所以他坚信,神策数据最有价值的分析结果,也离不开对精准数据源的采集。

数据沉淀就是数据采集,其途径有很多种,包括网络爬虫,用 Python 及 Go 等开发爬虫平台来获得信息;Wi-Fi 接入获得用户数据提供一些图像方面的 API,进行图片搜索及人脸搜索等。桑文锋说,神策的产品会记录多种数据源,不同终端(Web、App、H5、桌面软件)的用户行为,后端系统日志(Web server Log),业务数据(DB)等等。同时对前端、后端、第三方数据库、业务数据等全面采集,来保证数据源的准确和全面性,更好的进行数据分析,给业务带来新的增长价值。

基于上面所采集到的数据做统计分析、用户及品牌理解、用户画像等等,在分析能力上,支持多维事件分析、漏斗分析、留存分析、用户分群、行为轨迹分析和回访分析,不同分析模型帮助揭示数据背后的含义,了解产品的性能和优化方向。

为了将数据利用到极致,给客户带来更大的价值,神策数据在产品功能上下了很多功夫,具体概括为三大特点:

  1. 第一个特点就是提供私有化部署,将分析能力嵌入到客户的业务环境里,不去接触客户的数据,在一定程度上保证了客户的数据安全,而且对于金融领域的客户,这一点非常重要。
  2. 其次就是全端数据接入,随着数据分析越来越深入,越来越精细化,尤其是 O2O、金融类等客户,要考虑线上线下的数据结合,这样才能提供精准的分析。通过提供可视化埋点,SDK、工具导入等方式,帮助客户全方位细致的解决数据痛点。
  3. 最后一个特点是PaaS+SaaS 平台的结合。行业不同,需求各异,所以分析服务也要因人而异。PaaS 平台将底层数据和查询接口开放给客户,在此基础上进行二次开发,满足客户独有的分析需求和系统。

在商业化道路上,桑文锋坦诚的说这不是一个新市场,和同行不一样的地方的在于,神策数据提供灵活多维度交叉分析,任意维度进行交叉分析等精细化功能。在未来神策数据也将朝着产品智能化的方向前进。

我的原则和价值观

后来,桑文锋提到了在给客户提供服务之后,如果客户后期因为各种原因而没有坚持用完,神策数据也会主动将费用退还。宗旨就是希望神策数据的数据分析能力可以给客户带来价值,给双方带来价值。

有人问桑文锋,最在意的是什么?他说,最在意客户的满意度以及 NPS。其实他所在意的这些完全取决于产品的质量。只有质量过关,才能取得客户的信任,客户才会把神策数据推荐给其他用户,从而建立更广泛的合作。

2017-02-19 04:331082

评论

发布
暂无评论
发现更多内容

DistSQL 深度解析:打造动态化的分布式数据库

SphereEx

数据库 开源社区 ShardingSphere SphereEx #开源

2022年中国人工智能产业生态图谱

易观分析

人工智能

你离「TDengine 开发者大会」只差一条 SQL 语句!

TDengine

tdengine 开源 时序数据库

还在用 ListView?使用 AnimatedList 让列表元素动起来

岛上码农

flutter ios 安卓开发 跨平台开发 7月月更

tsconfig.json在配置文件中找不到任何输入,怎么办?

华为云开发者联盟

JavaScript 前端

极客星球丨字节跳动一站式数据治理解决方案及平台架构

MobTech袤博科技

架构 运维 数据治理 全链路

活动报名:如何零基础快速上手开源的 Tapdata Live Data Platform?

tapdata

开源 开源社区 Tapdata 实时数据

“万物互联,使能千行百业”,2022 开放原子全球开源峰会 OpenAtom OpenHarmony 分论坛即将开幕

kk-OSC

开源 开放原子全球开源峰会

这样优化Spring Boot,启动速度快到飞起!

艾小仙

Java 微服务 springboot Eureka 微服务治理

跟我读论文丨Multi-Model Text Recognition Network

华为云开发者联盟

人工智能 文字识别 语言模型 视觉特征

接口文档进化图鉴,有些古早接口文档工具,你可能都没用过

Liam

Postman 接口文档 API swagger API文档

个人实战经验:数据建模 “账户数据是属于维度还是账户域 ”

松子(李博源)

数据仓库 数据建模 数据中台场景实践

阿里云技术专家郝晨栋:云上可观测能力——问题的发现与定位实践

阿里云弹性计算

DevOps 运维 可观测性

java程序员培训班怎么选?

小谷哥

学习大数据技术之前做好这些准备

小谷哥

【干货】知识共享的障碍及解决方法

Geek_da0866

开发动态 | StoneDB 2022年版本发布里程碑

StoneDB

云原生 #数据库 大数据 开源 #开源

智能运维场景解析:如何通过异常检测发现业务系统状态异常

云智慧AIOps社区

人工智能 机器学习 异常检测 智能运维 状态管理

为Python打包创建一个世外桃源,解决打包太大且启动慢的问题

迷彩

pyinstaller 7月月更 Python打包

Tapdata 与优炫数据库完成产品兼容性互认证

tapdata

数据库 Tapdata 实时数据 交互式 优炫数据库

学好Web前端开发能找到好工作吗

小谷哥

Review 后台管理系统实战:请求参数的 2 种封装风格

掘金安东尼

前端 编程范式 7月月更

带你认识8个软件设计中的谬误

华为云开发者联盟

后端 分层架构 开发

26岁从计算机视觉界“黄埔军校”博士毕业,他想为车打造一双慧眼

华为云开发者联盟

人工智能 计算机视觉 天才少年 激光感知

易观分析《2022年中国数据安全市场数据监测报告》正式启动

易观分析

技术

wallys/new product/DR7915/MT7915+MT7975/WiFi6 MiniPCIe Module 2T2R

wallys-wifi6

学习java开发技术有用吗?

小谷哥

大数据培训机构如何选择

小谷哥

算法题每日一练---第4天:图像模糊问题

知心宝贝

算法 前端 后端 7月月更

李宏毅《机器学习》丨5. Tips for neural network design(神经网络设计技巧)

AXYZdong

机器学习 7月月更

8个方法管理 GitHub 用户权限

SEAL安全

git GitHub 安全 软件安全 软件供应链安全

神策数据CEO桑文锋:精准采集数据,走向智能化分析_语言 & 开发_Lucien_InfoQ精选文章