最新发布《数智时代的AI人才粮仓模型解读白皮书(2024版)》,立即领取! 了解详情
写点什么

为什么我劝你不要当数据科学家?

  • 2020-05-09
  • 本文字数:2734 字

    阅读完需:约 9 分钟

为什么我劝你不要当数据科学家?

数据科学家这一职位越来越火热,人人都想从事数据科学,这不仅因为这份工作听上去高大上,更重要的是,它真的是一份高薪的工作。但是,数据科学家是人人都能做得来的吗?


本文系一篇观点文章,我很乐意听到读者的反驳意见。


成为一名数据科学家是每个人的梦想。甚至连奶奶级的人也想当数据科学家。但是,尽管数据科学可能是 21 世纪最性感的工作,但另一个报酬也同样丰厚的高薪职业——软件工程师,却被低估了。


我经常会收到写刚毕业的学生和想改行的人写来的信,向我寻求从事数据科学的建议。我给他们回信说应该要去做软件工程师。


鉴于我在数据科学家和软件工程师都有经验,我会试着说服你去成为软件工程师。

1. 软件工程的工作岗位更多

与数据科学相比,软件工程领域的工作岗位要多上一个数量级。


下面是我在 Google 上搜索 Indeed(一家招聘网站)上的 “数据科学家” (Data Scientist)和 “软件工程师” (Software Engineer)岗位的截图。


Google 搜索美国 Indeed 数据科学家的结果截图


Google 搜索美国 Indeed 软件工程师的结果截图


从搜索结果来看,数据科学岗位有 7616 个,而软件工程的岗位有 538893 个!这还只是美国的就业情况,但其他国家也显示出类似的结果。


据 Glassdoor 的调查结果称,数据科学家的收入更高,但以我未经验证的假设是,数据科学领域的工作平均而言也更高级。


来源:www.glassdoor.ca


来源:www.glassdoor.ca


也就是说,如果你得到了 Open AI 给的 100 万美元薪水的工作机会,我会建议你要抓住这个机会。

2. “数据科学” 的含义还没有达成共识

管理层对 “数据科学” 的含义往往没有达成共识。也有可能是由于业务上的限制,他们没有办法生搬硬套一个角色框架。


这意味着 “数据科学家” 的职责因公司而异。


粗略描述


虽然从软件工程师到数据科学家之间的理想角色有可能存在,但在现实中却不大可能实现。这点对于那些仍在建设基础设施的初创公司来说尤为如此。


被录用的应聘者最终都是为了解决公司目前需要解决的问题,而不是他们可能被录用的 “角色” 。


来自该领域同事的轶事证据是,许多数据科学家发现,自己像软件工程师一样也要编写后端代码。我还认识其他所谓的 “数据科学家” ,他们是用 Excel 处理财务数据。


而这与参加过 Kaggle 的你的期望大相径庭。

3. 数据科学是孤军奋战的工作

大多数公司并不像软件工程师那样需要那么多的数据科学家。其他公司正在招聘他们的第一位数据科学家。


由于这个原因,许多数据科学家最终都将是孤军奋战,即使他们和开发人员在同一张桌子上工作,也是如此。


这可能会导致很难获得反馈和第二种意见。软件工程师要么不懂预测建模,要么忙于处理完全不同的问题。


相比之下,在软件工程团队的好处之一就是能够对同事们说: “我认为我们应该用 XYZ 的方式实现 ABC。你有什么看法?” 。


要从事数据科学的工作,请做好和你自己或者一只橡皮鸭进行这样的对话的准备。


4. 数据科学是探索性的工作

你要做好与管理层进行尴尬对话的准备,解释为什么你花了两个礼拜的时间做的东西还不能用。


致力于解决已解决的问题与未解决的问题,是软件开发与人工智能的根本区别之一。


撇开错误和约束不谈,在开始任何工作之前,你就应该知道大多数软件工程项目是否可行。但在机器学习领域就不能这样说了,因为你只有在构建模型之后才会知道模型是否有效。

5. 公司还没有为人工智能做好准备

即使在每家公司都是人工智能公司的时代,大多数公司也不具备支持人工智能的基础设施,甚至不需要它。


最近,一家快速扩张的初创公司的数据科学负责人在与我喝咖啡的时候分享了一些建议。


首先,要找出问题所在,然后构建基础设置,再引入数据科学家。这可不是一个快速的过程。(我的转述大意)


最近,另一家知名公司的从事数据科学的零号员工向我发泄。她吐槽称,她被迫在笔记本电脑上而不是在云端上的大数据训练人工智能模型。


如果你被录用后没有具体的问题需要解决,或者公司没有做好数据科学的准备,你可能会发现自己很难提升价值。

6. 软件工程传授通用技能

成为一名初级软件工程师就像获得了技术领域的 MBA,你所学到的东西都只不过是沧海一粟。


你要学习数据库、云技术、部署、安全性和编写简洁的代码。


你要通过观察 Scrum 领导、高级开发人员或项目经理来学习如何管理软件的开发。


你要通过代码审查来得到指导。


如果你进入的公司拥有一支成熟的工程团队,你几乎可以保证你会很快提升自己的技能,并打造出一个通才的背景。

7. 软件工程更具可转移性

通过提供更全面的技术体验,当你决定是时候改变时,软件工程提供了更好的退出机会。


DevOps、安全、前端、后端、分布式系统、商业智能、数据工程、数据科学……


我认识一些从软件行业改行到数据科学的开发人员。如果你浏览一下数据科学的岗位描述,你会立即注意到,岗位描述到处都是核心的软件开发技能。


来源:Indeed


如果你能构建端到端的项目,那么你还可以做更多的工作,而不仅仅是为 Kaggle 构建模型。你可以采用该模型,将其产品化,设置授权和条码,然后开始向用户收取访问费用。这就是你自己的初创公司。


我从来不认为数据科学是不可转移的。根据数据做出决策是一项杀手级技能。但随着我们变得越来越以数据为导向,这也将成为我们每一项工作的一部分。

8. 机器学习将成为软件工程师的工具

随着人工智能的产品化和易于使用,软件工程师将开始使用人工智能来解决他们的问题。


我可以用一下午的时间教会开发者如何构建 Sklearn 分类器。但这并不意味着他们可以构建下一个 AlphaGo,不过,这确实给了他们一个替代基于用户输入的硬编码条件逻辑的选择。


数据科学家有专业知识,比如统计学,以及对模型如何工作的直觉。但 DevOps 和安全工程师也有自己的专业知识。


我认为这些都是常见的,没有什么不同。 一个经验丰富的软件专业人员在不同专业之间的转换速度比一个新入行的人选择一个专业的速度要快一个数量级。


虽然我不认为我们会看到数据科学完全合并到软件工程中,但我确实感觉数据科学有可能会成为另一个软件工程专业。

9. 人工智能不会取代软件工程师

尽管这观点听起来很傻,但我在 2014 年进入了软件工程领域,因为我担心人工智能会让其他工作都被淘汰。


然而从那时起,这一状况就几乎没怎么变过。技术采用的速度很慢,人工智能的应用范围比媒体想象的要窄得多。


与其他专业相比,机器学习离自动化软件工程更远。虽然我们有初创公司在构建酷炫的产品,比如人工智能代码完成,但编写代码并不是真正的工作。这项工作是用技术来解决问题。


在奇点出现之前,软件工程仍然将是一项宝贵的高薪技能。

结 语

首先,本文所述都是轶事。其次,我意识到我将数据科学家、机器学习工程师和人工智能研究人员混为一谈了。但我认为,这些论点仍然值得考虑,因为这是你的职业。


我姑妄言之,你姑妄听之,不必太过当真。我希望你自己研究一下,然后再做决定。这毕竟是作为数据科学家的一部分。


说到底,我们的工作就是解决问题。


原文链接


https://towardsdatascience.com/dont-become-a-data-scientist-ee4769899025


公众号推荐:

跳进 AI 的奇妙世界,一起探索未来工作的新风貌!想要深入了解 AI 如何成为产业创新的新引擎?好奇哪些城市正成为 AI 人才的新磁场?《中国生成式 AI 开发者洞察 2024》由 InfoQ 研究中心精心打造,为你深度解锁生成式 AI 领域的最新开发者动态。无论你是资深研发者,还是对生成式 AI 充满好奇的新手,这份报告都是你不可错过的知识宝典。欢迎大家扫码关注「AI前线」公众号,回复「开发者洞察」领取。

2020-05-09 16:194860
用户头像
陈思 InfoQ编辑

发布了 576 篇内容, 共 262.6 次阅读, 收获喜欢 1293 次。

关注

评论

发布
暂无评论
发现更多内容

听GPT 讲Rust源代码--compiler(30)

fliter

Programming Abstractions in C阅读笔记:p254-p257

codists

linux系统下多种yum repo创建教程

百度搜索:蓝易云

Linux 运维 yum 云服务器

HDFS 小文件合并最佳实践

冰心的小屋

NameNode 海量小文件

Ableton Live如何设置中文?ableton live 11 mac中文破解版 永久可用

Rose

mac音乐制作软件 Ableton Live 11破解版 Ableton Live 11中文版

【豆瓣8.4】《RabbitMQ实战指南》PDF

程序员李木子

Atlassian 停服 Bitbucket?三步快速迁移至极狐GitLab

极狐GitLab

《数字化运维路线图》第二部分 震撼发布!

博睿数据

可观测性 运维监控

Nop入门:极简数据访问层开发

canonical

mybatis 低代码 ORM graphql

hazel mac破解版 自动化文件清理工具 含hazel激活码 兼容m1 m2

Rose

苹果软件资源 Hazel 下载 Mac自动清理工具 Hazel Mac破解版

文心一言 VS 讯飞星火 VS chatgpt (187)-- 算法导论14.1 4题

福大大架构师每日一题

福大大架构师每日一题

GarageSale for Mac(mac eBay在线拍卖客户端)v9.6.0激活版

影影绰绰一往直前

百度反链是什么? 如何查询百度反链?

百度搜索:蓝易云

云计算 百度 运维 SEO 云服务器

Tipard Video Converter Ultimate for Mac(视频格式转换工具)v10.2.52中文版

影影绰绰一往直前

数字人源码刷新认知,市场前景可期!

青否数字人

数字人

视频文件损坏如何修复?QuickTime 无法打开视频文件?视频闪烁如何解决?

Rose

视频文件损坏 QuickTime 无法打开视频 视频闪烁

OmniFocus Pro 3 for Mac 中文破解版下载 强大的任务管理工具

影影绰绰一往直前

在线 cURL 参数对比工具,让你的开发工作更加高效

秦少卫

curl 接口工具 调试工具 请求参数对比 参数格式化

“数字人”走进我们生活了!

青否数字人

数字人

Be Focused Pro for Mac(任务时间小工具)v2.4.1激活版

影影绰绰一往直前

Keep It for mac(Mac笔记软件)v2.3.8激活版

影影绰绰一往直前

【豆瓣9.1】《大数据处理框架Apache Spark设计与实现(全彩)》PDF

程序员李木子

使用阿里云Rocky Linux镜像源替换默认源教程

百度搜索:蓝易云

云计算 Linux 运维 云服务器 Rocky

最强GTD时间管理工具OmniFocus Pro 3 for Mac最新激活版 附注册机 兼容M1/M2

Rose

苹果软件 OmniFocus 下载 Mac任务管理器 OmniFocus Pro 3 GTD时间管理

【Linux技术专题】「夯实基本功系列」带你一同学习和实践操作Linux服务器必学的Shell指令(深入Kill指令探索)

洛神灬殇

Linux Shell 2024年第二十二篇文章 技术指令

应该如何选择轻量级低代码、重量级低代码、轻量级低代码+定制、纯定制软件开发?

天津汇柏科技有限公司

低代码开发 低代码,项目开发 定制软件开发 软件开发定制

AnyMP4 iPhone Password Manager for Mac(iPhone密码管理器)v1.0.20激活版

影影绰绰一往直前

C# 面向对象编程解析:优势、类和对象、类成员详解

小万哥

C# 程序人生 编程语言 软件工程 后端开发

Programming Abstractions in C阅读笔记:p258-282

codists

Aiseesoft HEIC Converter mac:HEIC格式的文件转换为图片格式

Rose

Mac软件 图片格式转换 HEIC格式 HEIC Converter

为什么我劝你不要当数据科学家?_AI&大模型_Chris_InfoQ精选文章