AICon 上海站|90%日程已就绪,解锁Al未来! 了解详情
写点什么

Quora 数据科学家和机器学习工程师是如何合作的

  • 2015-12-17
  • 本文字数:974 字

    阅读完需:约 3 分钟

数据科学家和机器学习工程师如何有效协作是一个困扰许多公司的问题。在前不久于旧金山举行的 MLConf 大会上,Quora 工程副总裁 Xavier Amatriain 介绍了他们应对这一问题的方法。近日,他又援引Quora 数据科学家 William Chen 的说法进一步阐述了 Quora 的做法。

按照 William 的说法,在 Quora,机器学习工程师是工程部门的组成部分,而数据科学家是数据科学部门的组成部分。工程部门负责构建产品和算法,并保证其快速可靠地运行,而数据科学部门负责理解 Quora 的数据,并指导产品决策。但机器学习工程师和数据科学家都会参与机器学习项目,他们的工作主要有如下两个方面的差别:

  • 机器学习工程师构建、实现和维护机器学习系统;
  • 数据科学家进行研究,提出有关机器学习项目的构想,并通过分析了解机器学习系统对公司指标的影响。

更具体地讲,机器学习工程师负责:

  • 构建和实现机器学习系统;
  • 维护机器学习系统,包括速度、可靠性和性能;
  • 开发供内部(机器学习工程师和数据科学家)使用的机器学习框架,为了一些常见任务(如训练 / 测试)提供便利。

数据科学家负责:

  • 评估潜在的或现有的方法、功能、算法或误差度量指标,帮助改进机器学习系统;
  • 分析机器学习算法对公司关键指标的影响;
  • 通过构建机器学习模型(仅用于一次性分析而不放入生产环境)研究和了解用户行为模式。

通常,机器学习项目会同时配备数据科学家和机器学习工程师。在 Quora,他们通过如下三个步骤实现合作:

  • 数据科学家进行研究,确定机器学习系统可能的需求或改进项;
  • 机器学习工程师构建、实现或改进机器学习系统;
  • 数据科学家评估机器学习系统对公司关键指标的影响。

对于 William 的说法,Xavier 作了一些补充。他认为,机器学习团队和数据科学团队的界限很模糊。他更喜欢谈论两者的工作重心,而不是界限,因为定义团队的目标是明确重点,而不是制造分歧。同样地,机器学习工程师和数据科学家的界限也不清晰,那取决于个人的职业选择和背景。例如,机器学习工程师并不一定是个编码专家,他可以是一个有丰富机器学习经验的人。数据科学家同样如此。


感谢杜小芳对本文的审校。

给InfoQ 中文站投稿或者参与内容翻译工作,请邮件至 editors@cn.infoq.com 。也欢迎大家通过新浪微博( @InfoQ @丁晓昀),微信(微信号: InfoQChina )关注我们,并与我们的编辑和其他读者朋友交流(欢迎加入 InfoQ 读者交流群InfoQ 好读者(已满),InfoQ 读者交流群(#2)InfoQ 好读者)。

2015-12-17 18:002258
用户头像

发布了 1008 篇内容, 共 411.2 次阅读, 收获喜欢 346 次。

关注

评论

发布
暂无评论
发现更多内容

SRE方法论之拥抱风险

不思jo

#运维

国产游戏引擎,竟然用来搞民航

Openlab_cosmoplat

人工智能 开源

保密+完整+可用+安全,规避代码安全「马奇诺防线」,构建软件供应链整体安全

极狐GitLab

高可用 DevSecOps geo 代码安全 软件供应链安全

ChatGPT到来个人如何应对

程序员半支烟

人工智能 职业成长

如何一行代码实现 OpenAI 可观测,大幅提升使用体验

观测云

云计算 可观测 观测云 ChatGPT 可观测性用观测云

软件测试丨Python学习笔记之内置库科学计算、日期与时间处理

测试人

Python 软件测试 测试开发

一文看懂数据云平台的“可观测性”技术实践

科技热闻

腾讯云首发多款领先新品,TDSQL全新特性助力国产化替代提速

科技热闻

腾讯安全携手行业伙伴,详解攻击面管理(ASM)技术的“拓客”潜力

极客天地

低代码开发——进最热的赛道,啃最硬的骨头

引迈信息

前端 低代码 快速开发 JNPF

inBuilder低代码平台开发者分享课丨提交PR的正确姿势

inBuilder低代码平台

实践「容器镜像扫描」,Get 云原生应用的正确打开方式

极狐GitLab

Docker DevOps 云原生 DevSecOps 容器镜像

Web3和低代码开发:下一代Web应用开发的合作与创新

加入高科技仿生人

前端 Web 低代码

ChatGPT:DevSecOps 落地实践的最后一公里

极狐GitLab

DevOps 云原生 Code Review DevSecOps ChatGPT

让算力不再成为瓶颈,小红书机器学习异构硬件推理优化之道

小红书技术REDtech

机器学习 架构 异构计算

操作系统国产化步入深水区,小程序技术助力生态搭建

FinClip

2023年中国国民家庭阅读白皮书

易观分析

家庭 阅读

行业分析| 快对讲-融合会议的应用

anyRTC开发者

音视频 视频会议 快对讲 融合会议 电话会议

【换模型更简单】如何用 Serverless 一键部署 Stable Diffusion?

Serverless Devs

云计算 Serverless AIGC

iTubeGo YouTube Downloader 快速下载视频~

真大的脸盆

Mac 视频下载 网页视频下载 Mac 软件 下载视频

基于HTML5智慧产业园三维可视化运维平台

2D3D前端可视化开发

物联网 数字孪生 三维可视化 工业组态 智慧产业园区

OpenCloudOS 如何基于 eBPF 实现容器级别的TCP 连接监控?

OpenCloudOS

Linux

Golden Gate (GGX) 启动公测,下一代创新DeFi和跨链 dApps 征程开始

股市老人

架构实战-毕业设计

程序员小张

「架构实战营」

量化交易系统开发——现货策略

薇電13242772558

量化策略

Vue3迎来升级,全面助力企业数字化转型

引迈信息

Quora数据科学家和机器学习工程师是如何合作的_语言 & 开发_谢丽_InfoQ精选文章