写点什么

滴滴宋世君:DS(数据分析师),究竟是做什么的?

  • 2019-09-16
  • 本文字数:3478 字

    阅读完需:约 11 分钟

滴滴宋世君:DS(数据分析师),究竟是做什么的?

本文的作者是滴滴出行数据科学部负责人宋世君,曾在 Facebook 、Google 核心部门就职,是知名的华人数据分析总监。经世君老师授权在此分享给大家,希望让大家理解数据分析师的背后——数据对于一个产品的核心价值,无论把握数据的是 DS,还是研发、产品同学。希望能够帮到你。


DS 在市场上是近些年出现的一个新的职能,比起研发、算法、产品、运营等等这些已经演进二三十年的职能,我们还是在非常年轻的阶段。


一方面,从市场上人才的供需关系可以看出来这个职能的发展和需求,但是另一方面,和任何新事物一样,这个新的职能也有很多挑战,今天我想谈谈我怎么看待 DS 这个职能,和我们的发展方向。


首先,我们要明确 DS 并不是一个公司的”必要”职能,但是在一个公司的发展壮大过程中又会有 DS 出现的必然性和存在的合理性。我们就像一把枪上的准星,没有准星也能开枪,但是准星能使这把枪更加有用。公司没有任何人做数据分析,短期也依然能运行,只是很多地方运行地会不太好;如果有一天公司里做数据分析的人都消失了,公司短时间内也不会垮掉,但是时间长一些肯定会有影响。


当我们不是”必要”职能的时候,我们就要问自己“DS 是谁”、“DS 做什么”、“DS 存在的价值是什么”、 “DS 要往哪个方向发展”?

DS 是谁

用心理学的术语,这个其实是 DS 的“本我”。我们是一群在相关量化领域受过专业的训练,并且希望应用自己的量化能力,在数据中挖掘对业务有用的信息,并且通过这些信息为业务发展提供助力但是同时又保持数据的中立性的人。


一个职能(或者说公司里的一个岗位)是由他应该做什么决定的,而不是由他正在做什么决定的。所以,我们描述 DS ,更多的是从我们自己觉得我们应该做什么,而不是我们现状做什么。比如很多同学有这样的疑问” DS 做大量取数的事情”,甚至很多业务合作方”期待我们满足很多取数的需求”。这些都与 DS 是谁无关,这只能说明我们还没有做好我们的工作,还有很多地方需要努力 ( 后面会展开谈 )。


从个体的角度,这也意味着我们看待 DS 并不是看这个人的学术专业,而是看这个人的动机和意愿。公司里跟数据有关的职能是多样的,有些是把数据作为拿到业务结果的抓手。要对业务结果负责,这些是数据运营。有些是把数据作为研发的对象,对跟数据相关的这些产品负责,这些是工程研发。有些是基于数据做实时地在线实现,这些是算法工程师的工作。


这些都是我们的合作伙伴, 但是我们又有我们自己的定位, 跟这些都不同. 我们应该为我们工作的中立性和科学性负责. 我们需要有业务的思想, 但是我们并不是要做业务本身, 我们希望做业务发展的催化剂。

DS 做什么

我总结我们做的事情,可以抽象成三类 (1) 描述现状 (2) 寻找规律 (3) 推动改进。这三类事是逐层推进地,但是都很重要。


DS 首先要描述现状,也就是我们常说的 “数数”。


当我们连客观现状都描述不清楚的时候,是谈不上寻找规律和推动改进的。我们工作中大量的取数工,我们做指标,做数据报表看板等等都是在这一类之中。但是为什么很多同学对 “取数”工作有很大疑惑或者是觉得没有成就感呢?我觉得这是因为我们在被动地取数,或者说我们并没有把取数本身和自己业务的主线联系起来,而仅仅是在做填空题。


另外,我在数据分析十条中提到 “分析什么问题,往往比用什么方法更重要”,应用在取数上就是 “取什么数”、“为什么取”往往比 “怎么取”、“是多少”更重要。很多时候,从业务角度思考 “为什么取”就能给我们更强的价值感,如果能主动去思考 “为什么取”,则更加会有参与感。虽然这是第一步,但是价值是极大的,如果不能帮助公司描述现状,公司就是在盲目前进。这第一步就要求我们的每位同学有独立思考尤其是批判性思考的能力。


DS 还要寻找规律。


数据分析的本质就是要寻找规律,寻找那些数据信息中隐含,但是别人还没发现的规律。我们常说的统计推断、因果关系、增长推动、预测建模、实验评估等等都是在寻找规律。这些规律就是我们常说的 “洞见”。


当然, 有含金量的规律是不容易发现的, 这也正是我们 DS 存在的价值. 如果我们能看到的规律大家都能看到,那么我们就没有提供价值;谁能挖掘的深, 谁能看到更本质的规律, 谁就提供了更大的价值,所以我们的学术训练、科学方法、实践经验、数据敏感度等等都是在帮我们发现别人看不到的价值。所以我鼓励大家在描述自己的工作的时候,出发点不应该是我用了什么方法,而是我发现了什么规律 ( 洞见 )。这要求我们的每位同学有很强的好奇心和坚定的信念。


我们描述现状和寻找规律,最终的目的都是为了推动改进,这也就是我们常说的影响。我总结过 DS 的影响可以分成四类: (1) 改善重要指标 (2) 影响产品决策 (3) 影响操作流程 (4) 创造可持续解决方案。


如果我们做了一些事,但是没有直接或间接地实现这四类里面的任何一类,那我们要反过来思考下我们是不是把时间花在了正确的地方。以及我们以后要怎么做,才能让我们的单位时间投入产出最大化?更理想的情况,是在做事之前,先想想 ( 如果是被动需求的话,问问需求方 ) 我们要做的事会在哪些方面产生影响。要实现这些影响,还要求我们的每位同学有同理心和业务 (产品/运营/市场等)思维,同时还要有精炼的能力,优秀的沟通技巧,说服的能力。理解了我们影响力可以发挥的四个维度,也就解释了“ DS 存在的价值是什么”。从心理学的概念,这相当于 DS 的 “超我”。

DS 要往哪个方向发展

这相当于是 DS “自我”的问题。


我把这个问题总结成两个方面 “能力建设”和 “文化建设”。在能力建设方向,打铁还需自身硬。我们要有能力做更加深入的分析,应用更加科学的工具,让别人做不了的东西我们能做,别人看不到的规律我们能看到。这里要强调一点,就是能力不光是技术能力,还有业务思考的能力。我们组织 Delta 计划就是为了帮助同学们提高这种能力。我们也鼓励大家多通过行程学习小组、轮岗、和团队里的资深专家交流的方式。提高自己的能力。同时,我们也鼓励大家多站在业务的角度,思考数据能发挥什么作用,。多从各业务 leader 那里学习他们的思维方式和角度,然后结合我们的数据积累形成我们自己的东西。


跟能力建设同等重要甚至更重要的是文化建设。我们改变环境 ( 同事、公司、行业 ) 怎么看待 DS ,首先要坚定我们自己怎么看待自己。这里有自信的问题。我们的价值是由我们做的事情决定的 ( 自我 ) ,这个并不依赖于外界对我们的认知和肯定;我们要提高自己的价值,本质上也是如何让自己做的事情更有价值。有了自信,我们才能有方向去引导我们的合作同事怎么看待我们,怎么知道我们能做什么更有意义,别人怎么看待自己,本质上反应地是自己怎么看待自己。如果我们自己就觉得自己应该取数,那在别人眼里就是取数。如果我们告诉别人,我们的时间用在其他 ( 更有价值 ) 的地方对业务帮助更大,那么我们和对方都有意愿去这样做。而我们通过努力能够兑现这些,会让对方更加认定我们这个定位,形成正反馈。


大家在 DS 团队遇上的问题,我若干年前在 Google 和 Facebook 都遇上过,但是通过我们整体团队的努力,逐步证明自己,在市场上树立了 DS 的品牌和认知,并被市场上认定为这个职能的标杆。DS 作为一个职能,也获得跟工程、产品相类似的地位,近期多次被评为最有前景的工作。这个过程是逐步的,是需要时间的,也需要我们一起努力。


我们在滴滴其实也是在做这么一件事,DS 和数据驱动的理念在中国发展尚早,很多事情还停留在理论和感性层面,相当于硅谷若干年前的状态。这也是为什么我们这个部门的同学面临这么大的迷茫,而我们这些 leader 要帮助大家坚定方向,因为我们是市场上引领这个职能的一群人,在探索和拓展着这个职能的边界,而这个过程注定是有挑战的。和其他职能不同,我们的各位 leader 和基层同学, 在做具体事情的同时,还在创造着这个职能的历史。

数据分析十条

最后,我还想重新提一下我总结过的 “数据分析十条”,上面讲的很多方面都在这十条里面有反映:


  1. 分析师的核心能力是思辨 [DS 做什么]

  2. 对讲真话负责,保持中立 [DS 是谁]

  3. 论据充分,论证严谨,观点简明 [推动改进]

  4. 数据先于观点,而不是观点先于数据 [DS 做什么]

  5. 不要把问题复杂化,也不要惧怕复杂度 [DS 是谁, DS 做什么]

  6. 分析什么问题,往往比用什么方法更重要 [描述现状]

  7. 好的分析师给别人输入,而不只是帮别人输出 [文化建设]

  8. 分析没有什么价值,除非洞见改变了什么其他的东西 [非必要职能]

  9. 如果可能应该基于问题收集数据,而不只是基于数据来问问题 [本文未提]

  10. 不是所有问题都可以分析出答案,以开放的心态采纳其他的观点 [本文未提]


本文转载自公众号滴滴技术(ID:didi_tech)。


原文链接:


https://mp.weixin.qq.com/s/-c_voRweDXxjrU_OKx2Oxw


2019-09-16 23:102313

评论

发布
暂无评论
发现更多内容

七牛云霍锴:实时音视频 SDK 设计实践

七牛云

七牛云存储 音视频 ECUG

2021 年最新版,阿里巴巴 / 今日头条 / 京东 Java 面经大合集(含答案)

Java 编程 面试 IT 计算机

同事吃透了这份“阿里 Java 面试核心知识手册”6月份居然斩获 11 张大厂 Offer!

Java 编程 架构 面试 IT

阿里 Java 面试爆出内幕?十万字内部面试题总结(2021合格版)全网开源!

Java 编程 程序员 架构 IT

保险=诈骗?区块链赋予保险的“四个机会”

旺链科技

区块链 保险业 信任构建

在小厂工作三年的程序员喊话大厂:Java 中高级岗面试为何越来越难?

Java 程序员 架构 面试 IT

涨薪 150%,从小厂逆袭,坐上美团 L8 技术专家(面经 + 心得)

Java 编程 程序员 架构 IT

神啦!最全“Java面试宝典+Java核心知识集”,一箭双雕杠秋招

Java 程序员 架构 面试 IT

为了彻底搞懂 hashCode,我钻了一下 JDK 的源码

沉默王二

Java

迈入 8K 时代,AI 驱动超高清 “视” 界到来

阿里云CloudImagine

阿里云 高清视频 视频处理 视频制作 视频云

IOS技术分享| 互动连麦场景实现

anyRTC开发者

ios 音视频 移动开发 视频直播 直播连麦

2021 年云安全:基本工具和最佳实践业务指南

九河云安全

合并两个有序数组

Memorys

Java 面试 算法

保险污名化?区块链赋予保险的「四个机会」

CECBC

解读区块链技术在中小企业中的4种常见用例

CECBC

如何利用 Apache APISX 提升 Nginx 的可观测性

API7.ai 技术团队

nginx 开源 网关 APISIX

企业架构概述

涛哥 数字产品和业务架构

高防服务器在使用过程中可以做到高效、稳定的防止钓鱼攻击

九河云安全

针对不同场景的Python合并多个Excel方法

Python研究者

Python Excel 8月日更

入职那天“直接起飞”!双非渣本后端,两个月逆袭字节?

Java 编程 程序员 面试 计算机

我是一个下「笨功夫」的人

非著名程序员

个人成长 认知提升 个人提升 8月日更

什么是通证经济?它和区块链又有什么关系呢?

CECBC

站在巅峰的阿里面试参考指南!居然能让我成功拿下 12 家大厂 offer?

Java 程序员 架构 面试 IT

三年豹变!拥抱Z时代,UDE迈向消费电子国际大展

科技热闻

AlertManager 告警发送频率探究

greatersecurity

人类高质量程序员如何过七夕?

InfoQ写作社区官方

话题讨论

浪潮云洲智造直播间,继续开讲!

云计算

总结分析组件化漏洞产生的原理

网络安全学海

黑客 网络安全 信息安全 渗透测试 漏洞分析

支付通道接口异常统计上报

try catch

Java 失败上报

我终于在六月份实现了跳槽九连杀:字节跳动 Java 研发岗

Java 编程 面试 IT 计算机

链路压测中的支路问题初探

FunTester

性能测试 测试框架 压力测试 全链路压测 测试开发

滴滴宋世君:DS(数据分析师),究竟是做什么的?_大数据_宋世君_InfoQ精选文章