写点什么

Quora 数据科学家和机器学习工程师是如何合作的

  • 2015-12-17
  • 本文字数:974 字

    阅读完需:约 3 分钟

数据科学家和机器学习工程师如何有效协作是一个困扰许多公司的问题。在前不久于旧金山举行的 MLConf 大会上,Quora 工程副总裁 Xavier Amatriain 介绍了他们应对这一问题的方法。近日,他又援引Quora 数据科学家 William Chen 的说法进一步阐述了 Quora 的做法。

按照 William 的说法,在 Quora,机器学习工程师是工程部门的组成部分,而数据科学家是数据科学部门的组成部分。工程部门负责构建产品和算法,并保证其快速可靠地运行,而数据科学部门负责理解 Quora 的数据,并指导产品决策。但机器学习工程师和数据科学家都会参与机器学习项目,他们的工作主要有如下两个方面的差别:

  • 机器学习工程师构建、实现和维护机器学习系统;
  • 数据科学家进行研究,提出有关机器学习项目的构想,并通过分析了解机器学习系统对公司指标的影响。

更具体地讲,机器学习工程师负责:

  • 构建和实现机器学习系统;
  • 维护机器学习系统,包括速度、可靠性和性能;
  • 开发供内部(机器学习工程师和数据科学家)使用的机器学习框架,为了一些常见任务(如训练 / 测试)提供便利。

数据科学家负责:

  • 评估潜在的或现有的方法、功能、算法或误差度量指标,帮助改进机器学习系统;
  • 分析机器学习算法对公司关键指标的影响;
  • 通过构建机器学习模型(仅用于一次性分析而不放入生产环境)研究和了解用户行为模式。

通常,机器学习项目会同时配备数据科学家和机器学习工程师。在 Quora,他们通过如下三个步骤实现合作:

  • 数据科学家进行研究,确定机器学习系统可能的需求或改进项;
  • 机器学习工程师构建、实现或改进机器学习系统;
  • 数据科学家评估机器学习系统对公司关键指标的影响。

对于 William 的说法,Xavier 作了一些补充。他认为,机器学习团队和数据科学团队的界限很模糊。他更喜欢谈论两者的工作重心,而不是界限,因为定义团队的目标是明确重点,而不是制造分歧。同样地,机器学习工程师和数据科学家的界限也不清晰,那取决于个人的职业选择和背景。例如,机器学习工程师并不一定是个编码专家,他可以是一个有丰富机器学习经验的人。数据科学家同样如此。


感谢杜小芳对本文的审校。

给InfoQ 中文站投稿或者参与内容翻译工作,请邮件至 editors@cn.infoq.com 。也欢迎大家通过新浪微博( @InfoQ @丁晓昀),微信(微信号: InfoQChina )关注我们,并与我们的编辑和其他读者朋友交流(欢迎加入 InfoQ 读者交流群InfoQ 好读者(已满),InfoQ 读者交流群(#2)InfoQ 好读者)。

2015-12-17 18:002069
用户头像

发布了 1008 篇内容, 共 389.4 次阅读, 收获喜欢 344 次。

关注

评论

发布
暂无评论
发现更多内容

第 13 周 系统架构作业

心在那片海

长期主义是一种生活态度

JiangX

28天写作 价值 长期主义

Soul 网关源码阅读(六)Sofa请求处理概览

Java 源码阅读 网关

HDFS杂谈:Xattrs扩展属性

罗小龙

hadoop hdfs 28天写作

第13周作业总结

hunk

架构师训练营第2期

万亿级数据库MongoDB集群性能数十倍提升及机房多活容灾实践

杨亚洲(专注MongoDB及高性能中间件)

MySQL 数据库 mongodb 分布式数据库mongodb Qcon

英雄惜英雄-当Spark遇上Zeppelin之实战案例

王知无

大数据 spark

Week13 作业

evildracula

架构

产品经理训练营 - 第一章 - 作业

Jeremy

Week 13 数据应用

evildracula

学习 架构

第13周作业

hunk

架构师训练营第2期

第八周学习总结

Binary

架构2期-第十三周作业(1)

浮生一梦

第十三周 2组 架构师训练营第2期

新名词意味着什么?

lidaobing

28天写作 名词

绩效管理,上下同心者胜(二)

一笑

管理 绩效 28天写作

Spring-Spring整合MyBatis原理分析

魔曦

第八作业

Binary

什么是VXLAN

与前端训练营的日子 --Week12

SamGo

学习

你不可不知的任务调度神器-AirFlow

王知无

spark 数据可视化 airflow

手写实现单例代码



十三周作业

落朽

28天瞎写的第二百二十一天:争论 IBM AIX 版本号,只因好强?

树上

28天写作

第一周作业

Au revoir

SQL 正则表达式

.

28天写作

产品训练营第一周作业

孤星

架构师训练营 4 期 第3周

引花眠

架构师训练营 4 期

第 13 周 系统架构总结

心在那片海

外星人?他们在哪儿呢?「幻想短篇 10/28」

道伟

28天写作

产品第一周

骏马

软件架构-缓存技术

看山

缓存 架构

Quora数据科学家和机器学习工程师是如何合作的_语言 & 开发_谢丽_InfoQ精选文章