大多数人都没有足够的能力成为合格的数据科学家
回答者:Riya Dubey,数据科学家 回答于 2018 年 10 月 24 日
谢邀,我的答案可能会伤害那些胸怀抱负的数据科学家们的感受。不过我还是得实话实说——大多数有志者都没有足够的能力成为合格的数据科学家。请不要误解我的意思,但大多数希望成为数据科学家的朋友都不具备足够的技能储备。
虽然市场对于数据科学家确实有着巨大的需求,但大多数人的技能都太烂了(请原谅,我就是这么坦率)。
并不是企业不想雇用新人担任数据科学家这类角色。事实上,不只是应届毕业生,就算是企业通过社招吸纳的数据科学家们也未必能够顺利完成任务。**数据科学是一类极具挑战性的工作,要求敏锐的分析能力、强大的数字能力以及卓越的商业理解能力。**即使我们立刻着手学习这些技能,要达到游刃有余仍然需要耗费漫长的周期。简单地总结,单凭在大学里的教育背景不足以支撑大家完成相关工作。
而以上提到的,还只是数据科学所提出的最低技能要求。从行业角度来看,迈入数据科学领域还需要其它多种技能。下面来看其中的一些主要项目:
1.对于统计及统计学技术几乎无可挑剔的认知与理解。
2.你需要对推理统计数据拥有良好的控制能力。
3.良好的 R 与 Python 编程能力。这两种是目前大家最需要了解的高人气数据科学语言。
4.数据可视化技能,包括对 Tableau 以及 Qlikview 等工具的熟练掌握。
5.预测建模能力,意味着你需要了解各类机器学习算法。
现在,着眼于上述技能,大家会意识到其涵盖范围极广,甚至足以彻底将我们吞没。更具体地讲,要精通这些技能需要相当长的时间——更遑论很多人穷尽一生可能也无法掌握。
很少有企业会雇用应届毕业生出任数据科学职位,但在接受企业培训并拥有 6 到 12 个月的工作经验之后,他们会逐步赢得数据科学家头衔。Mu Sigma、LatentView Analytics 以及 Absolute data 等就是这类开放性企业的典型代表。然而,必须承认,鲜有公司愿意提供这样的机会。
需要考量的另一大重要因素在于,大多数希望出任数据科学家的年轻人都就读于 IIT/NIT 以及 BITS Pilani 等顶尖高校。企业意识到,这类大学的毕业生技术能力出众,学习速度快且能够轻松完成训练。因此,企业更倾向于选择这些高校的学生。在入职之后,这些学生会自行学习其它技术性技能,或者接受企业内部提供的培训。
然而,对于其他一些毕业生来讲,以上只是一种不切实际的幻想。因此,要进入数据科学领域,你只能全程自学。
目前存在众多面向数据科学方向的平台,你可以在其中学习数据科学领域的各类技能。Data camp、Data Science.com、Coursera、edX 以及 Udemy 等都能够为你提供理想的技能积累环境。
除了上述平台之外,大家还应该尝试 Kaggle 以及 KDnuggets 等,这些是通过数据科学项目磨练水平的好去处。事实上,这些平台甚至更为重要。正如我之前所提到,数据科学极具挑战性,因此除了真正投身于实际项目之外,大家根本不可能真正加以掌握。
因此,在大家通过上述平台学习时,请确保同时参与具体项目以实现理论与实践的结合。此外,大家还需要利用这些项目展示自己的实际工作能力。在数据科学领域,我们参与的项目以及借此做出的有价值的贡献才是对技能的真正考验。对于新手而言,数据清洁往往最为重要。而如果你才刚刚起步,那么参与项目绝对是个良好的选择。当然,你所选择的项目,最好涉及一切作为数据科学家所需要的技能方向。
总体来讲,作为一位胸怀大志的数据科学家,如果你希望找到理想的工作,请遵循以下方法:
学习数据科学领域的必要技能。
开展项目工作,借此建立自己的技能组合并磨练技术水平。
赢得数据科学职位。
除此之外,我还建议你参考 Gautam Tiwari 给出的以下答案,以了解如何以新手面貌迈入数据科学领域。
Gautam Tiwar 的回答:应该如何迈出成为数据科学家的第一步?(https://www.quora.com/What-will-be-the-first-step-to-be-a-data-scientist/answer/Gautam-Tiwari-27)
每一家企业都希望选择“最具性价比”的目标候选人
回答者: Jon Wayland,数据科学家 回答于 2018 年 10 月 23 日
今年春季,我和我的未婚夫买了辆新车。买车当然不是件小事,原本我们也根本没打算买,但这辆车一下子抓住了我们的心。我们也考虑了其它一些车型,并且进行了全面的试乘试驾体验。
我们对于自己的需求有着非常明确的认知,但最终促使我们下定决心的,还是这款产品的出色性价比。
与汽车类似,数据科学家同样成本高昂。身为客户,企业雇主当然希望找到那些最能满足自身需求的目标。
你认为哪些因素决定着他们的招聘意愿?
想象一下,对于典型的数据科学职位,候选人的分布可能如下所示,其中 x 轴代表“符合要求”的情况,或者说人才自身吸引力的直观指标:
备注:上图完全基于我的假设,与实际数据无关。
另外需要注意的是:
每一家企业都希望获得标注为绿色的候选人。
标注为绿色的候选人希望选择最出色的企业。
标注为蓝色的候选人愿意就职于任何企业。
标注为红色的候选人根本搞不清楚自己的求职需求。
像我们普通人一样,企业也有预算额度,而且不愿意接受存在风险的支出。标注为绿色的候选人最为安全,标注为蓝色的候选人由于缺乏经验而代表存在风险,而标注为红色的候选人则直接被排除在外。
那么,作为客户,你认为企业会做何选择?
如果我们能够购买一台全新的微软 Surface 笔记本,或者是选择一款号称具有同等配置且几乎同等价位的“即将推出”的新产品,你会如何决定?
毫无疑问,市场对于标注为绿色的候选人拥有最迫切的需求。每一家企业都希望选择这类人才,而鲜有企业愿意选择标注为蓝色的候选人并承担相关风险。
总而言之,每一家企业都希望选择“最具性价比”的目标。
我还没见过任何真正的初级数据科学家
回答者: Mike West,Pluralsight 公司机器学习讲师(2018 年至今) 回答于 2018 年 10 月 22 日
答案很简单,数据科学家职位对技能在深度与广度层面的要求远远超出大多数人的认知。
由于大多数现实世界中的数据科学任务,具体体现为机器学习,而机器学习属于一类硬核编程工作。
如果你无法使用 Python 语言编程,那么你根本得不到这份工作。事实就是如此。
因为你无法完成数据清洁工作,因此没人在乎你能多么高效地从 GitHub 上复制现成代码。
因为 SQL 远比建模更重要,而新手们根本就不明白这背后的原因所在。我们不再关注那些 SQL 实际使用经验不足两年的候选人。事实上,学习建模要比学习关系数据库理论简单得多。
数据处理是一项极为艰深的工作。
因此如果我是一家企业的老板,而且我愿意拿出 15 万美元以上雇用一名员工,那这家伙最好能够充分满足我提出的技能需求。
在接触这一领域五年之后,我还没见过任何真正的初级数据科学家——这里只存在初级机器学习工程师,而且他们大多是由编程或者数据相关岗位转型而来。
数据科学岗位候选人的增长速度远超过就业机会的增长速度
回答者: Vincent Granville 回答于 2018 年 11 月 2 日
回答原文链接:https://www.datasciencecentral.com/profile/VincentGranville
造成这种现象的主要原因,在于数据科学岗位的候选人正呈现出指数级增长,而就业机会虽然同样增长极快,但却不足以抵消新生人才数量。这在一定程度上类似于博士生的全面爆发,其直接导致博士学历的市场竞争力快速削弱。有人可能会想:为什么还会有那么多人愿意读博?几年下来,市场对于人才的要求可能已经发生剧变了呀。没错,我认为这个问题的答案在一定程度上与数据科学家问题存在相似之处:
四年之前,当企业找不到任何真正合格的数据科学家时,这些企业在学术界与 Data camps 的帮助下,刻意营造出了人才极度匮乏的整体印象。
这使得市场呈现出一种类似庞氏骗局的形势,如今许多所谓的数据科学家并没有真正的一线工作可做,而只能转向为那些有意成为数据科学家的年轻人提供教学服务。对于博士生来说情况同样如此:很多人开始靠帮其他人当论文枪手来赚钱。与此同时,企业也开始以越来越谨慎的态度审视那些自称为“数据科学家”的候选人的实际价值。
与大多数博士生一样,特别是那些拿不出什么原创性研究成果的新人,他们的学位价值开始大幅下降。必要承认的是,时至今日,来自顶尖大学的毕业生仍然能够比较轻松地找到一份理想的工作——这一点同样适用于数据科学家群体。
只接受过短期培训的人们将很难找到工作。然而,像地理学家、工程师或者拥有丰富专业数据经验的物理学家这样的群体,虽然可能没有接受过正式的数据科学培训,但却仍然能够更轻松地拿到数据科学家的 offer(虽然具体职称可能略有不同)。与许多应届毕业生一样,他们的职业经历就如同实习经历一样能够为其提供有力的积累与证明。
目前有很多人自称为数据科学家,但他们的实际水平最多只能算“数据科学爱好者”。由于缺少实践经验,他们很难找到合适的工作。
当企业进行校招并与应届毕业生交谈时,年轻人们往往能够比较轻松地得到实习岗位。这种方式在效率上远高于通过互联网进行简历盲投。或者,当你看到 Facebook 公司发布的数据科学工程师招募广告时,你也可以想办法与其互动并发布一些有水平的评论,而非坐等人力部门与自己联系。事实上,如今简历已经变得非常过时,有可能再过一段时间就会彻底消失在历史舞台之上,至少我认为是如此。为什么不在 GitHub 上(或者其它重要网站上)发布一些贡献呢——只要项目或内容质量足够好,广受好评并得到采用,我们总有办法向企业证明自己的价值。
约有 90%的朋友希望通过领英与我联系,但我往往会直接拒绝,因为他们与数据科学毫无交集。与大家一样,我只能与 3 万个人建立关联,因此我得精心安排这些名额。企业的情况是差不多的,他们需要考虑自己的预算水平。
根据你的实际定位与工资预期,就职情况可能比我之前提到的略好或者更差。某些数据科学家(通常负责管理大型团队)能够在美国或者其它一些国家拿到超过 25 万美元的年薪,而也有一些数据科学家能够管理自己的公司并获得超过 50 万美元的年收入——这些都属于合理范围。但如果你无法达到基准水平(即能够产出实际价值)的要求,那么你的收入将与前者天差地别。
原文链接:
评论