Ron Brachman 是雅虎研究院院长,他在 2005 年加入雅虎,并参与建立雅虎研究院。雅虎研究院由一群热血的计算机科学家和研究工程师组成的群体。他们开发助力当下和未来的雅虎服务的技术。雅虎研究院聘用了 200 名研究科学家、研究工程师、小部分的学术关系和运营团队。仅在 2013 一年里,就聘请了 55 位拥有博士学位的顶尖人才。
在加入雅虎之前,Ron 曾任美国国防部高级研究计划局(DARPA)信息处理技术办公室主任。在这之前,Ron 曾任职于贝尔实验室及 AT&T 实验室的多个不同的管理职位和研究领导职位。
DARPA 是如今许多被广泛应用的科技的发明者,如互联网就是由 DARPA 的前身 ARPA(Advanced Rearch Projects Agency)研发的,包括全球卫星定位系统(GPS)、隐形战机、砷化镓都出自 DARPA。
日前,InfoQ 受邀与 Ron Brachman 会面,Ron 畅谈了个人职业规划、雅虎研究院的发展与核心价值。以下为对话全文:
问:请介绍下雅虎研究院的情况?
Ron Brachman:雅虎研究院是雅虎里面向未来的一个研究机构,不仅做传统的基础研究,还做很多应用方面的研究。研究院的功能是作为一些大胆想法的孵化器,把它们变成现实。同时我们也跟雅虎内部的工程师和其他同事一起去改进我们的产品,给我们的全球用户提供最好的体验。雅虎研究院是一个有机的整体,虽然我们在全球的不同地点都有我们的研究人员,但是我们是一个团队,他们都汇报到我这,我直接汇报给 CEO 梅耶尔。
我们在这里面不仅从事基础研究,同时我们也真正会深入到产品的研发中去,会针对增进产品的一些性能去做很多非常实际的应用工作。我们在这边做的这个研究领域是非常宽泛的,从自然语言处理到算法,信息安全,社会学研究,甚至宏观经济和用户的研究,我们都会有涉猎。我要说的话可能说一天一夜,但是你们请提下面的问题。
问:雅虎研究院其实也做很多实际的应用研究,具体是怎么来做的呢?
Ron Brachman:雅虎这个公司还是比较特殊的,他的产品线非常长,也非常多,技术也很复杂,而且全球 8 亿用户也是一个超级大规模的量。雅虎研究院在机器学习和算法等方面,都是应用在这种超大规模的用户的基本上,所以我们很多的工作其实也是开创性的。对于雅虎来讲,如何提高广告主的满意度和对用户的吸引力是非常重要的。如果只有一个广告主和一个用户,那去匹配他们是很容易的。那在如此大量的广告和 8 亿用户的前提下,怎么能让广告精准的投放到用户?怎么样能让用户看到他感兴趣的广告?这个就需要我们的科学家团队在很多方面去做,比如像机器学习、配对、存储、网络,甚至于如何提升销售平台,这个都是我们在做的一些应用型的工作。
我们致力于解决的问题,雅虎及整个业界也有很多成熟的技术,但是怎么能把这些成熟技术合并在一起共同应用来解决,这个也是我们在致力于的一个方向。比如说现在非常复杂的个性化的问题。每个用户都有自己不同的兴趣,这个就需要我们在算法方面不断的去加强。比如说今天的日期、用户的兴趣、用户最近的一些点击行为,用户告诉我们他对哪方面感兴趣,还有他的朋友正在分享的一些事情,还有今天的网络热点,这个都需要我们对非常大规模的数据进行实时的分析,在非常短的时间内,给用户推荐他们可能感兴趣的文章。
我刚才讲的这些基于用户不同的兴趣来做推荐,也需要我们利用不同的算法工具,从数学的角度去做一些建模,然后去做一些研究。比如说像这种社交网络的推荐,这个就需要应用不同的算法,从不同的渠道拿到信息,那这个就是应用科学很大的研究领域。
最后,我最自豪的就是在过去九年里面,我们发表了很多论文,做了很多基础研究,同时我们也应用了一些非常高难度的数学,还有一些基础的科技知识。跟雅虎的全球工程师进行紧密合作,真正把这些技术落实到了雅虎的产品里面,然后为用户带来更好的体验,这也是我认为其它的实验室没有像雅虎做的这么好的原因。我们在北京的这个科学家团队,他们做得也非常好,他们在个性化和广告等等方面,跟北京的全球研发中心的工程师一起,做出了非常大的成绩。
问:您有在 DARPA 的工作经历,对您在雅虎研究院的工作有哪些帮助?
Ron Brachman:DARPA 也是一个非常高效的部门,他会去评估这种项目值不值得投资,他也会去鼓励一些非常疯狂的想法,也会去投资,让他们变成现实。在 DARPA 的工作经历,是能教会人怎么样去做正确的决定,如何去监督整个研发实施的过程,以及去深入评估它的结果。那我下面会介绍一下,这些经验是怎么样帮助我在雅虎研究院的工作的。
至少可以想到有四件事情是我在 DARPA 的工作经验可以帮到我现在的工作。
- 第一,DARPA 会资助很多长期高风险项目,他们的一个愿景就是这些项目的实施,真的能够改变世界和改变人类的生活。所以在 DARPA 即使是一个很小的项目方案,你也需要去阐述这个项目如果成功了,如果最后付诸实施了,世界会得到什么样的改变,人们的生活,或者我们的未来会有什么样的改变。在 DARPA 大家都有一个共同的理念,即使是最基础的研究也得到真正的效果,这个效果真正会去造福使用他的人。其实在雅虎我们有非常多的,非常优秀的科学家,但是我们毕竟是雅虎公司的一个实验室,所以我在评估的项目的时候,经常会对他们说,如果这个项目成功了,世界会有什么样的改变,我们的用户会得到哪些方面的福祉。而不是说你觉得这个项目很牛,他就很牛。在雅虎我们鼓励科学家去做基础研究,但是你一定要给我一个你理想中的结果,如果它成功了,到底会有什么样的影响和效果,那我们也会尽全力去保证它们真正的取得成功。
- 第二,我学会了一套评估系统。即使你是在科学研究,你也一定要设定目标,还有怎么样去评估,就是达到什么样的成果,就会认为你这个项目是成功的。在雅虎,研究项目开始之前,我也会要求大家给一个简要的整个项目介绍,而且非常重要的就是如何去评估这个项目的成功,如何界定你的算法、程序、系统是成功的,那我们也会根据这个,到最后去评估这个项目的成功与否。通常来讲科学家是不喜欢这种评估系统的,他们更喜欢去发表论文,去做一些他们认为很重要,但是可能实际影响没有那么大的这个项目。那么我们在雅虎就开始实施这套绩效的评估系统,我们也希望能够保证他们的研究项目最后是有影响的。
- 第三,DARPA 有一个优势,他是全国范围内的超大规模的研发。只要是 DARPA 能够采纳的项目,全国范围内最好的大学和最好的公司里面科学家和工程师,都会来积极的参与。我也意识到这一点是 DARPA 的一个成功要素,就是会有不同种类的专家,还有在各个方面都会有人来组成一个团队去做事情。我曾经在 DARPA 主持的项目很多都是国家级的项目,有的甚至有超过 20 家高校和公司的科研团队在参与。我们在雅虎在全球不同的地方一共有 9 个研究院,我们的科学家有不同的背景,从事不同领域的研究。那他们的这种有机融合,就会产生一些非常有趣,而且非常高难度的科研成果。
- 第四,DARPA 的项目是非常大的,花费了非常多的纳税人的钱,所以保持 DARPA 的使命,就是做一些非常高难度的尖端研究就显得非常重要。同样雅虎的研究院也是雅虎公司花很多很多的钱来支持的部门,雅虎也是鼓励研究院去做一些真正的与众不同的项目,所以我们的目标必须非常的远大,我们的野心也是非常大的。雅虎研究院会定期设定我们的目标,其中很多目标是极度拉伸的目标,如果能成功,那真的就是一个非常大的成就。有这样极度拉伸的目标,也促使我们去很多非常大胆的尝试,希望能够有一些极大的成功。从表面上看 DARPA 和雅虎是非常不同的,但是我在 DARPA 学到的很多经验对我现在的工作也是非常有帮助的。
问:你从哈佛毕业以后,在很多公司也工作过,每一次工作的选择是如何做的?
Ron Brachman:非常有趣的问题。我认为我是一个非常幸运的人。我曾经有幸在这么多的顶级机构里面去从事研究工作。我曾经工作过的机构和我一起共事的人,都是非常棒的。所以我从来没有想过我要离开他们,但是在一段时间以后,整个的这个情况发生了改变。我换工作的想法就是,如果我换工作,那我要去的地方一定也是非常好的,尤其是那里的人一定是特别好的。他们会有非常冲高的使命要值得我跟他们一起去完成,这样我才能去考虑换到其它的地方。
我曾经的这些工作机会都太好了,所以我每一次换工作的时候,我也会考虑,它一定要有新的跟以前不同的东西。但是我也从来没有创过业,当年我从波士顿搬家到硅谷去,也是因为当时人工智能的这个大潮兴起,硅谷当时是整个人工智能研究最尖端的地方,同时也有很多新的事情,那边等待着有能力的人去从事。所以当时我就到了硅谷开展我的研究。我当时从硅谷又到贝尔实验室,部分是因为我的家庭原因,我的家人在那边。另外一方面是贝尔实验室当时也开始做人工智能的研究,我当时有机会去领导一个团队,从零开始去开展人工智能方面的研究。
我个人来讲,我是非常喜欢这种从零开始的挑战,那 DARPA 的任期只有 4 年,到 4 年就必须要离开。当时正好是 2005 年,雅虎研究院成立了,又是要从零开始。我当时作为它的联合创始人之一,又要开始招人,做计划,去制定我们研究院的使命,这个是没我觉得非常兴奋,而且有挑战的一个工作。
雅虎作为互联网的鼻祖,当时有令我感到震惊的用户人数,那不仅仅是在一个公司里面去开展我的研究,而是在一个非常伟大的公司,它当时有超过 5 亿用户,去做改变他们日常体验的这种工作,我认为是非常令人激动的。
问:组件雅虎研究院遇到了哪些困难?怎么解决的?
Ron Brachman:当时我们有两个非常大的挑战,到现在仍然还是一个挑战的就是关于最好的人才方面挑战。雅虎是一个伟大的公司,但是当时并没有做这种研究的历史,在这个相同的情况还发生在 AT&T 还有贝尔实验室当中,在我的领域当中,当时在那边也都是从零开始。所以当时最大的困难,就是怎么样招来最初的那两三个人,或者一小批非常勇敢并且有非常大名气的科学家。
另一个挑战是,当时雅虎从来没有做过这种科学方面的研究,怎么样说服工程师来相信科学家真的能帮到他们,这是当时的一个非常大的挑战。
当时我们只有一个办法,只是劝说别人加入是没有用的,必须拿事实说话。让工程师知道我们愿意用他们的工作方式去工作,用我们的所学去帮助他们实现他们的目标,去让他们的产品做得更好。当时来讲这个工作是非常困难的,要花很多的时间和精力去跟工程师打交道。在九年以后,现在的情况已经完全反过来了,工程师还有业务部门追着我们来要更多的支持,所以我们必须不停的雇更多的科学家,然后把这个分成优先级,看看先去支持哪些项目。
我也非常高兴现在终于把这个事情做成了,我们现在非常的核心项目都是由科学驱动的研发项目,这也是我们雅虎北京研发中心的一个主要战略,就是用科学驱动的工程(Science driven engineering)。我们这边的科学家、工程师也是在一起进行紧密的合作,去做公司的全球的很多核心项目。
问:我们都知道广告对于雅虎来说是非常重要的,雅虎研究院正在做哪些跟广告相关的研究?因为工程师是有限的,时间是有限的,我想了解一下,你们把最重要的资源,放在哪几个核心的与广告相关的项目上?
Ron Brachman:您说得很对,有非常多的项目,我们评估项目的时候,首先要确定它是不是真的需要科学家的帮助,是不是真的需要在从算法上,从机制上,从建模上去做很多的工作?我们试着去决定,看看这个科学家团队是不是能在这个项目里面起到四两拔千斤的作用,能够用我们有限的资源去实现最大的影响力。如果有一些问题,我们认为工程师团队就能解决的话,我们不会放太多的资源在上面。在那些真正的需要很多资源的项目上,比如说像机器学习,像这种经济学模型等等这些方面,我们会放更多的资源在上面。
在雅虎广告很多领域当中,科学家都做了很大的贡献。一个例子是显示广告。这也是雅虎的一个强项,有非常大的市场。我们需要做的就是从科学的领域,去帮助我们的销售团队做一些方案,一些很大的销售举措,去帮助广告主精准的投放他们的目标受众。这样我们会从科学的角度去指导我们的销售团队,用什么样的方案能够让广告主得到他们最大的利益。
雅虎的整个交易规模是非常大的,有几千家的广告商要做广告,他们都有一个整月的计划。那么我们就要从科学的角度就要去预测,这个月到底有多少个广告位能用。这指的不是说哪个固定广告,比如说文章里可以插两个广告这种。如果说我们的预测不准确,假如我们的销售团队销售出去了 1000 个广告,到月底我们却发现只有 900 个广告位,还有 100 个放不了。雅虎没有赚到这笔钱,广告商也会非常生气。我们的科学家们就要通过算法和建模,去做一些精准的预测。这也是帮助我们的销售团队更好的跟广告商去工作,以便实现我们的广告位收益的最大化,这也是我们几年来一直在做的一项工作。
另外,我们做出非常大的贡献就是广告的定价,这个是非常复杂的。因为互联网公司的广告价位不统一。需要有一个平衡,说这个广告商愿意花多少钱在客户上,以及我们可用的广告位等。他的定价非常复杂,我们需要用大量的数学建模和工具,来实现这个巧妙的定价,让公司的利益最大化。
最后,雅虎的广告有成千上万个,当一个个体的用户在浏览的时候,可能在终端上,也可能是在手机上,我们只有一次机会给他推荐适合他的广告。我们会结合当时的天气,他的兴趣,他在浏览的是什么频道,会结合非常多的因素。从我们的成千上万的广告里面,选择出来最适合他的广告推荐给他,这样的话,他的用户转化率和点击率一定是会非常高的,这需要非常复杂的数学的建模和算法。
这些看似随意的广告的选择和推送,还有包括我们最优化的广告定价,怎样去指导销售团队与广告客户提供最好的服务,这些都是我们科学家团队和研究院,能够做出非常大贡献的领域。
问:造成科学人才欠缺的主要原因是什么?
Ron Brachman:我总是非常愿意听到有人愿意来雅虎从事科学研究,我们一直在招人,我们在人才方面的挑战是多方面的。我们通常来讲都是要招有博士学位的人,但是在计算机科学这个领域,本来博士就非常少。除了博士以外,我们也招这种有硕士学位的研究工程师,好的工程师能做研究的也是非常少的。
不可否认雅虎也不是世界上唯一的一个公司需要这方面的人才。我们也是花了很大的精力去找到这些潜在的好人选,我们花时间指导他们,请他们来实习。我们也花很多时间去做这种高校关系,把很多数据给学校,让他们去做研究。我们也让这些候选人知道,对于做这种基础研究和应用研究来讲,雅虎是一个非常高大上的地方。
我们也会花很多的精力去跟这些年轻人探讨,不管是不是在雅虎研究院中探讨,他们怎么样能有一个很好的职业生涯的发展和选择职业的方向,这个也是我们会花很多时间去做的项目。那我们也花了很多的力气,把我们的工作环境变成一个最佳的工作场所。我愿意告诉大家的是雅虎是一个非常非常有趣的工作场所。你会跟很多牛人一起工作,有很多很好的项目,而且你会为这个世界制造一些不同,这是非常令人激动的。
问:雅虎北京的研发中心在雅虎全球研发中心当中,是不是处于关键地位?目前北京研发中心主要承担了哪些研发工作?
Ron Brachman:雅虎北京研发中心,在整个雅虎全球的个性化方面的研发上,居于非常核心的地位。雅虎现在发现我们其实就是一个做个性化的公司,我们把整个互联网以个性化的方式呈现在用户的面前,这个就需要非常多的努力在个性化的研发上,雅虎北京的团队在这方面就扮演了一个极其重要的角色。
广告是雅虎成功的关键,北京研发中心的这个团队在这方面也是有非常深的介入,在我们全球的广告方面的研发,也是居于一个核心的地位。北京的全球研发中心,的确是雅虎全球研发版图中非常重要的一块,那我在北京的这个研究院的这些同事,也是我们全球研发,包括我们核心的广告方面的非常重要的一支团队。
雅虎在北京的这个全球研发中心,同样也是在移动和云计算方面有很大的贡献。雅虎现在有一个口号叫移动第一,这也是公司前进的一个方向。现在的这个四大研发方向(科学驱动的个性化、广告、移动和云计算)是北京的主要的工作领域,雅虎北京在公司的全球研发当中有着非常重要的地位。
评论