写点什么

数据科学家与软件工程师能否一人兼顾?

  • 2019-11-05
  • 本文字数:1726 字

    阅读完需:约 6 分钟

数据科学家与软件工程师能否一人兼顾?

在这篇文章中,作者试图说明软件开发人员和数据科学家这两种角色所需要的技能并不像人们所说的那样,它们其实并没有相差得那么远。


因为我有软件开发背景,所以当一些同事说一个人不能同时兼顾数据科学家和软件开发人员这两种角色时,我会感到很惊讶。此外,有很多人说数据科学家所需要的技能与软件开发人员所需要的技能是不一样的。虽然这些说法在某种程度上可能是对的,但在这篇文章中,我将试图说明这两种角色所需要的技能并不像人们所说的差得那么远。它们看起来并不像这样:



而是像这样:



事实上,数据科学也可以从软件开发领域获取经验。在本文中,我将提到一些可能会有用的实践。我的观点是,一名优秀的具备一定机器学习和人工智能知识的软件开发人员可以为企业带来极大的价值。


可能会有人问我为什么要写这篇文章。好吧,我感觉我们的行业里存在一些不好的风气。我从来都不喜欢那些所谓的“精英”人士,我也花了很多时间与那种“高高在上”的态度作斗争。在我的一个有关如何对抗焦虑、小我和过度热衷某些事物的演讲中,我就讲到了这个话题。当然,这只是我的个人观点,是基于我个人经验得出的,如果你有任何不同的想法,请在评论区留言。

简洁的代码


数据科学家都是聪明人,他们的数学能力和从不同角度看待数据的能力令人叹服。但是,有时候阅读和理解数据科学家的代码可能会是巨大的痛苦。在团队中,这可能会是一个大问题。优秀的软件开发人员学会了如何用简洁的代码来表达复杂的思想和概念。但在我看来,数据科学家在这方面还差得比较远。


另一种观点认为,编码只是数据科学家的一个临时工具。在未来,工具将朝着可视化的方向发展。这种说法在某种程度上也是对的。但即使是这样,编码也仍然是数据科学家工具箱中的一个宝贵的工具。软件开发工具也会朝着这个方向发展。例如,现在有各种 CMS 和开箱即用的解决方案可以帮我们快速创建网站。


但我们需要注意的是,这些工具究竟可以帮助我们走多远?另外,请想一想 CMS 开发人员与精通某种 JavaScript 框架的开发人员之间的薪水差异。在我看来,编码技能是必不可少的,至少在很长一段时间内是这样。在编码方面精益求精对于个人和整个团队来说都有巨大的好处。

版本管理和自动化


机器学习模型和神经网络最终会被部署到某种应用中,但有时候它们也需要进行重新训练和维护,其中一些需要额外的人工输入。软件开发人员知道在部署过程中可能会出现哪些风险,他们还知道如何通过(模型的)版本控制来降低这些风险,以及如何对部署和训练进行自动化。

数 学


之前已经说过,数据科学家具有高超的数学能力,这是毫无疑问的。但软件开发人员通常也具有扎实的数学功底,特别是那些拥有计算机科学学位的人。当然,他们很可能会把线性代数和概率论忘掉,但这个问题很容易解决。


最重要的是,优秀的软件开发人员能够快速地吸收知识,并将其应用到不同的技术中。如果一个开发人员具备了数据科学知识,他可以很容易地从 Python 转到 R 语言。

数 据


除了统计学家和数据科学家,还有谁会天天与数据打交道?是的,你们都知道我想要说的是谁。从职业生涯的第一天开始,开发人员就要学习各种存储、读取和显示数据的方法。SQL,一种可能会一直存在下去的语言,还可以转移到其他技术,如 Pandas。


除此之外,懂得如何使用 NoSQL 数据库(如 MongoDB)在近几年来也成了一项必备技能。开发人员也因此具备了大量非结构化数据方面的经验。另外,大多数软件开发人员都知道如何开发 Web 爬虫。

面向客户和演示


数据科学家需要为客户找到最佳的解决方案,并帮助他们改进业务。数据可视化和说明某些业务决策的基本原理是他们工作的组成部分。软件开发人员通常不太熟悉业务流程,但他们能够理解需求,并知道需要做些什么。技术团队负责人和软件架构师通常具备这些技能,所以在与客户的初始研讨会中,他们会显得非常有用。除此之外,如果开发人员经历过敏捷开发,他们可能会习惯于定期向利益相关者展示软件的功能特性。

结 论

在这篇文章中,我试图说明为什么软件开发和数据科学所需要的技能其实并没有相差得那么远。从软件开发到数据科学,对于优秀的软件开发人员来说应该不是什么大问题。


英文原文:


[https://rubikscode.net/2019/10/07/can-you-be-data-scientist-and-software-developer-at-the-same-time/


2019-11-05 11:021517
用户头像
陈思 InfoQ编辑

发布了 576 篇内容, 共 286.9 次阅读, 收获喜欢 1303 次。

关注

评论

发布
暂无评论
发现更多内容

面试处处碰壁?不慌,Java核心面试文档.PDF助你披荆斩棘

钟奕礼

Java java面试 java编程 程序员‘

目前看过最全的一线大厂面试题(题+详解),你所不知道的都在这

钟奕礼

Java java程序员 java面试 java编程

【Java经典面试800题】面试必备,查漏补缺;多线程+spring+JVM调优+分布式+redis+算法

程序知音

Java java面试 java架构 后端技术 Java面试八股文

集群部署看过来,低代码@AWS智能集群的架构与搭建方案

葡萄城技术团队

负载均衡 部署 集群 亚马逊

从零开始学习Java系列之Java运行机制与跨平台特性

千锋IT教育

车间工厂看板还搞不定,数据可视化包教包会

葡萄城技术团队

数据可视化 看板 智能工厂

“鸿蒙开发套件”焕新升级 端到端赋能助力开发运维事半功倍

最新动态

观察者模式在spring中的应用

京东科技开发者

Java spring 编程 观察者模式

东莞理工学院-网安学院举办第二届“火焰杯”软件测试高校就业选拔赛颁奖典礼

测试人

软件测试 自动化测试 测试发开 测试比赛

四项发明专利布局国际市场 申威睿思层级化数据库操作加速系统和方法获肯定

科技热闻

Spring6正式发布!重磅更新,是否可以拯救Java

宋小生

JVM 核心知识体系

钟奕礼

Java java面试 java编程 程序员‘

金九银十已过,总结了阿里面试官常问九大项面试题!

钟奕礼

Java java面试 java编程 程序员‘

瓴羊DAAS体系结构,助力乔丹体育高质量增长

瓴羊企业智能服务

《鸿蒙生态应用开发白皮书》正式发布,携手更多开发者迈入鸿蒙世界

最新动态

华为开发者联盟学堂上线超1800门课程,为开发者提供一站式赋能

最新动态

阿里资深架构师谈Java进阶攻略:7大技能+12份进阶笔记+面试150题

钟奕礼

Java 程序员 java面试 java编程

即时通讯赛道开打信创牌,WorkPlus为何独树一帜?

BeeWorks

高管对上新老板的 Twitter

HoneyMoose

咱也不知道这份牛P哄哄的【Nginx实战】资料是不是你们想要的

钟奕礼

Java 程序员 java面试 java编程

东莞理工学院-网安学院举办第二届“火焰杯”软件测试高校就业选拔赛颁奖典礼

测吧(北京)科技有限公司

软件测试

PGL图学习之项目实践(UniMP算法实现论文节点分类、新冠疫苗项目实战,助力疫情)[系列九]

汀丶人工智能

图神经网络 图学习 11月月更 论文节点分类任务 新冠疫苗任务

一次MTU问题导致的RDS访问故障

京东科技开发者

数据库 Linux MTU RDS vpn

A/B测试有哪些常见应用场景?——火山引擎DataTester科普

字节跳动数据平台

大数据 AB testing实战

【实用工具】解决PCB设计难题,痛击风险漏洞!

华秋PCB

工具 PCB PCB设计

即时通讯技术文集(第7期):长连接网关、P2P等 [共10篇]

JackJiang

网络编程 IM 即时通讯IM

单体分层应用架构剖析

京东科技开发者

架构 模块 应用架构 服务层 业务层

端云一体开发,助力鸿蒙应用开发效率全面提升

最新动态

EMQ宣布推出LF Edge eKuiper全新Logo标识

EMQ映云科技

物联网 IoT emq 11月月更 eKuiper

《鸿蒙生态应用开发白皮书》正式发布,携手更多开发者迈入鸿蒙世界

最新动态

DHorse系列文章之操作手册

tiandizhiguai

微服务 云原生 k8s管理 微服务治理 Serverless Kubernetes

数据科学家与软件工程师能否一人兼顾?_AI&大模型_Rubikscode_InfoQ精选文章