从 Google 回来的 CTO

2020 年 4 月 23 日

从 Google 回来的 CTO

人生都在做决定,你的每一个决定都决定着你的人生!


记得 2017 年上半年,叶绍志当时在 Google 工作,在接受温州网采访时,叶绍志博士说,经过这些年的积累,国内的信息产业发展很快,与国外的技术差距也在不断缩小,国内创业氛围很浓厚,机会也多,条件也比较成熟。对于个人接下来的人生规划,要不断思考和调整,希望能够遇到一个适合自己的机遇,遇到了就回来。



常言道,机会是留给有准备的人的。2017 年 9 月,叶绍志加入顺丰科技,当时在 LinkedIn 上的工作介绍是这么写的:


  1. Oversee product and engineering teams covering the entire parcel life period from ordering, to picking up, to sorting, to transportation, to delivery, to customer service.

  2. Plan and design our new air hub, which would be the largest logisitic hub in Asia.


在加入顺丰后,他主要做的是涵盖“订购、提货、分拣、运输、交货“等包裹生命周期的物流工作。


在此之前,他 2010-2017 年在 Google 参与搜索引擎索引与网页爬虫工作,主导索引算法变更仿真工具研发、网页刷新率估计;后来参与 Google+ 和 YouTube 的后端研发,主导索引系统升级和降本工作。


可见,两份工作是存在共性的,都是围绕软件系统展开;当然也有差异性,那就是领域的跨度。


InfoQ 在策划ArchSummit 全球架构师峰会(深圳站)2020的时候,邀请叶绍志博士担任会议联席主席,和我们一起筹备大会。在会议召开之前,InfoQ 采访了叶绍志,就他从 Google 到顺丰的这两年中,顺丰速运业务研发上的实践,以及自己多年的思考进行深入交流。


目标:通过技术手段实现降本增效


目前叶绍志在带领顺丰速运业务研发团队,简单来说是快递为主的传统业务,以及一些和新兴业务(快运、仓储等)共用的底盘系统,覆盖收派、中转、运输等物流全环节的人、货、场、运力等资源的运作和管理。现阶段的战略方向是帮助集团完成从数字化运作到数字化管理和智慧物流的升级,而 2020 年的主要工作目标则是通过技术手段提升产品的时效,降低成本。此外,作为顺丰科技架构委员会主席,他今年在大力推动公司的系统架构治理工作,具体内容会在今年深圳 ArchSummit 全球架构师峰会上分享。


在人们的普遍印象里,Google 节奏更快,新技术层出不穷,而顺丰更偏应用层面,鲜有技术研发。那么从 Google 到顺丰科技,有哪些工作经验或工作习惯是可以快速复制应用呢?在叶绍志看来,相比于 Google 这样的一线互联网大厂,顺丰科技目前正在朝着一个互联网化的企业方向努力的路上。


在工作环境上,Google 内部包括研发工具链、DevOps 体系等都是自研的,而顺丰科技作为以物流研发为主的公司,很大程度要借助开源社区和外部的力量,这样才能专注在主营业务(物流研发)上。比如顺丰科技一直努力引进 Docker、Jenkins、Dubbo、Kafka 等开源软件。但不可否认的是,开源工具的集成体验和自研体系相比还是要差一些,这方面顺丰科技也做了一些适配和集成工作。


在文化上,包括开放工作环境、弹性工作制、丰富的团建活动、员工关怀和福利等方面,两家公司都有一些相近之处。


不过在创新思路上,其实 Google 和顺丰还是有比较大不同的。对此叶绍志表示:“Google 的创新是技术驱动,很多时候先有锤子,再找钉子,在工程师眼中制造一个好的锤子本身就是非常有意义的事儿,某种程度上这种思路也支持 Google 探索很多无人区的业务。比如 Google 地球最开始是从一个初创公司收购来的,当时只是觉得他们的技术很棒很酷,而并没有完整的商业模式。”


顺丰在科技上的创新则是围绕业务场景来做。“顺丰的科技投入虽然在快递业算比较大的,但跟 Google 这样的技术巨人比还是要小得多。这决定了顺丰要把好钢用在刀刃上,更精准地投入资源。”在叶绍志看来,顺丰目前主要做两类事:一类是刚需但是市场上买不到的,比如收派运作 App;一类是需要具备差异化竞争能力的产品,比如人财物的解决方案有很多产品,但是支持顺丰几十万人体量和对应管理要求的,还是要走自研道路。


唯一的共同点是,这两家公司都认为只有持续的创新,才能在今天激烈的市场上长期保持差异化的竞争力。


深入一线才能深入理解物流业务


在 Google 工作时期所积累的后端研发、测试、运维等经验,帮助叶绍志在顺丰能很快将一些模式升级或者改变,因为单一环节上往往能改变的东西比较少。


叶绍志举了个例子。在顺丰做的第一个系统是晚上发版,看到同事们隔段时间夜里就要加班发版,叶绍志就很纳闷为什么。同事的回答是:因为晚上业务量小,发版的影响会小。这时候叶绍志才知道是因为没有蓝绿切换来实现对业务的平滑过渡,就要求团队改了。后来这个系统跟很多其他系统有交互,一些功能要其他系统配合,于是又夜里发版。所以,叶绍志推动那些系统也上线蓝绿切换。”从那时开始顺丰新建的核心系统,蓝绿切换就变成标配了。“


从顶级的软件研发团队切换到一个还在快速成长期的研发团队,势必会有很多落差,这也让叶绍志意识到,刚加入顺丰的时候对一些行为和理念充满疑惑,但大家却习以为常。也逐渐理解支持他们的土壤和基础是什么,然后思考如何能完成这个升级的过程。今年叶绍志在推动的架构治理工作就是一个例子。


但是业务领域的切换的确是非常大的挑战。叶绍志所带领的团队支持的速运业务有非常大的线下特征,和 Google 几乎 100%线上业务的情况完全不一样。所以叶绍志花了比较多的时间熟悉和学习业务。


“我在顺丰做的第一个项目就是中转场的作业工具和自动化设备软件换代。中转场的作业高峰在晚上和夜里,因为白天货物量少,就算系统有些问题,场地的同事也能人工处理了。到高峰期,系统一出问题,对线下的干扰和压力就特别大。最开始我用以前的办法,抓测试抓灰度,但是在白天就总是测不出来问题。最后每天晚上自己看,回答现场的问题,大概一个多月都是搞到夜里很晚,才弄明白了流程为什么这样设计,痛点在哪里,大的问题也就收敛了。现在产业互联网或工业 4.0 比较热,有兴趣从互联网行业投身到传统行业的朋友们要有这种深入一线的决心,才能真正理解业务,找到技术的发力点。”


顺丰数字化转型的挑战


据我们了解,顺丰在两年前就已经完成了数字化转型工作。但是数字化转型对于每一个公司来说,都是必经过程,顺丰科技在转型时比如在数据打通、平台建设技术上、AI 技术使用上有哪些挑战?又是如何一步一步解决这些难题的呢?


叶绍志说,传统企业数字化是一个比较热的话题,而顺丰完成的是“数字化运作”,即主要的操作是由系统流程支持,线下的行为是系统可视的。这个可以认为是数字化转型的第一阶段。这里面两个里程碑的事件就是电子运单和非现金支付。


和友商的区别是,顺丰很多运单不是从某一个平台集中下发的,所以之前存在大量的手写运单。2016 - 2017 年,顺丰努力推动配套流程、系统、工具的改造,建设了 C 端和 B 端的下单系统,包括现在成为业界标配的微信下单就是那个时候完善的。这个过程驱动配套的收派软件、订单管理系统、和收派任务分发系统的改造。这几个系统的打通和联动当时是一个很大的工程,包括大量的重建、改造工作。现在顺丰的运单电子化和支付非现金比例都很高。


”所以数字化转型是一个变革,它需要很大的业务驱动力和对应的科技能力提升,理念转型。不仅仅是系统重构,也是人和团队的升级和重构。成功了,它的收益也是很明显的,属于战略行为。“


目前,顺丰的数字化转型处在第几阶段?叶绍志认为处在第二阶段:数字化管理,用系统里看到的行为和数据优化线下运作,提升管理能力和对变化的响应速度。这个过程中,自然而然就有比上一阶段更多的系统打通工作要做。


一方面,之前数字化运作阶段关注的往往是单一环节的操作是否被系统管控和记录,现在要看的是如何让这个信息流传递到其他环节去,或者更快地传递到其他环节去。以运单电子化之后为例,后续的中转运输环节如何匹配今天揽收的件量来排布资源?现在顺丰的中转场管理人员可以看到今天已经有多少件会来这个场地,便于他们做好意外的应对准备。


另一方面,也提供了一些联合优化的机会。原先通过线下沟通或者反馈的办法才能解决的问题,现在有机会通过系统联动来解决。以考勤、排班和任务分派系统的打通为例,只要在排班系统里设好各个时间段有谁在值班,考勤记录下实际到岗情况,任务系统就可以分配到对应的员工,简化了原先要人工在多个系统里维护的管理工作。


在叶绍志看来,大数据和 AI 的工作在这个阶段更多是辅助管理的角色。比如上面说到的件量预测,一方面要看今天已经揽收的件量,同时要结合历史情况来预测今天总共会到的件量。这个事情听上去很简单,实际上因为管理区域的大小和业务的波动,对预测准确度要求非常高。比如说一个覆盖一大片 CBD 的网点和一个覆盖几个生活小区网点的件量稳定性是不一样的。同样是工业区,不同的产业不同的季节表现的行为也是不一样的。传统的统计方法的预测准确度能达到的上限是无法满足我们今天的精细化运作需求的。


于是大数据和 AI 的手段就有了用武之地。


因为疫情的影响,目前也迫使顺丰一方面要在很少的历史数据上重新做模型预测,另一方面模型也要随着疫情管控政策的变化而快速变化。”以往一周刷新一次的预测甚至凭管理者经验就可以搞定的稳态不存在了。在情况变化快的时候一天要刷新两三次预测。这个情况下非常地依赖团队的能力,因为要调整之前的模型,要做很多细分来处理不同的场景,要做工程化工作来快速响应需求。当然还要配合业务营运的同事来获得预测效果的快速反馈,迭代算法和模型。“叶绍志在讲这个案例的时候,研发团队当时的口号给我们留下深刻印象:一开始不准不重要,重要的是能快速变准。


下一个阶段:数字化决策 / 智慧物流


传统企业数字化转型的下一个阶段可能是“数字化决策”,对顺丰来说也可以叫“智慧物流”,即系统不再是一个辅助的角色,而是有一定的思考和直接指导运作的能力。但大规模的应用还有待技术的前进和业务模式的变革。


整体来说,顺丰这几年的实践表明大数据和 AI 技术在传统行业的导入期是比较长的。以视觉技术为例,顺丰 2017 年就做了基于摄像头的车辆装载率检测和作业违规抛扔检测。但是相对落地部署的硬件成本,这两个功能所产生的直接回报是不够的。经过 2018、2019 两年的持续打磨,也受益于硬件成本的下降和 AI 技术的发展,顺丰增加了破损检测、物资核销、快件复重稽核、运单规范化检测等视觉应用场景。”虽然覆盖的场景增加了,但这些功能可以复用一套边缘计算资源,极大降低了部署成本,这样我们终于使得落地成为可能。“


据叶绍志介绍,2020 年顺丰大部分的场地都会配上这套“慧眼神瞳”的场地视觉综合感知系统。”现在单一功能点就可以落地一个 AI 的应用并有足够好的收益已经越来越难了。顺丰的经验是要有整体布局,用组合拳来提升 ROI。当然这是需要一个过程的,需要公司对技术的支持和持续的投入。同时对研发团队的要求是能够一步一个台阶,阶段性有产出和突破,直到突破临界点。“


创新大旗:聚焦,且紧密结合业务


大多数公司在转型期间的主要挑战是怎么去找场景,同时把有效的方法和好的创新机制相结合、去探索。从上文我们也能看出,顺丰集团在技术研发上投入了很多资源,也有决心去做技术升级。


至于创新,要考虑大背景,相对很多互联网行业而言,顺丰身处利润比较薄的行业,所做的工作要在长短期收益里寻找平衡。在这种基调下的创新,一是要求聚焦,即围绕公司战略目标和核心业务场景来做。二是要求紧密结合业务场景。现在的竞争非常激烈,很多流程也很容易被复制,从互联网跨界做物流的玩家不在少数。对于顺丰来说,结合自身 27 年的运营积累和以直营模式打造的线下执行力,线上线下配合,系统和人一体才是顺丰核心的差异化竞争力。


一年一度的创新大赛则是顺丰这一年的重大创新工作的展示舞台,从全员投票开始,到路演,到最后颁奖,是顺丰参与度和规格都很高的活动。这个的要求也很高,比如 2018 年底那届最后一等奖就轮空了。”最高奖项叫“顺丰科技创新特别奖”,这么多年来只颁发了一次,获奖的是顺丰的无人机团队。所以,创新的机制是自下而上,各个层次,各种规格都要有的。只有足够肥沃的土壤才有机会孕育出来好的成果。“


顺丰速运技术架构的复杂性


顺丰大概从 2016 年开始引入 Dubbo、Spring Cloud,现在主要的核心业务系统都完成了微服务化。所用技术栈是追随业界主流方向的,包括 Redis、MongoDB、TiDB、ZooKeeper、Kafka、MyCat、Jetty、Saturn、React Native、Flutter 等,基本现在主流的开源方案和系统都有用,或者评估是否有引入的价值。


顺丰面临的挑战主要是业务的复杂性和技术债。


一方面物流的环节特别多,订单、收派、中转、运输每个环节都要考虑很多场景,比如订单就要分 C 端和 B 端,C 端又有微信公众号、各个生态的小程序包括微信小程序、百度小程序、支付宝小程序、华为快应用等。B 端有各大电商平台、大客户的系统和一些 ERP 系统对接等。运输也要分干线支线、二轮三轮四轮、铁路、客机腹舱、全货机等。


另一方面顺丰支持的业务也不局限于快递,有些系统是支持集团的新型业务,包括快运、仓储、国际、医药、冷运和同城。还有一些高附加值的供应链业务和依托于快递的增值服务,比如代收货款、通电安装。可以想象要支撑这么多场景和业务,什么时候个性化支持,什么时候通用支持,哪个功能在哪个系统里实现,这些都是经常要讨论和思考的。市场变化经常出现之前从来没有设想过的业务形态,存量系统的边界也经常被打破和挑战。


顺丰 27 年来 IT 系统经过若干次迭代,现在虽然多数的核心系统都是以主流的架构思想建设的,有一些历史比较久的系统存留,是推倒重建,还是继续在上面逐步迭代?快速响应市场需求,还是决定投入长久的系统建设,需要不断权衡,要想清楚才能下手。


重构可能是长期更好的选择,但是市场留给研发团队的时间是很短的。技术团队在还技术债的同时,又在积累新的技术债。估计这也是很多业界同行们面对的挑战和困局。


好消息是,随着软件工程实践的深入,团队架构意识的提升,先进的理念的落地,顺丰科技应对这些挑战的工具和能力也是与时俱进的。对此叶绍志表示:“ArchSummit 全球架构师峰会作为国内最大的专注架构领域的峰会也给了社区和业界非常多的帮助。我们这几年每年都有安排同事与会,带回来的很多东西也在内部分享和尝试。”


【活动推荐】


除了以上叶绍志老师回复的内容,关于顺丰科技系统架构治理相关细节,将在 9 月深圳ArchSummit全球架构师峰会上呈现。会议上还邀请了阿里云、网易严选等公司的技术专家来分享服务网格、云原生等服务治理话题,感兴趣的可以查看官网详情。


2020 年 4 月 23 日 15:184117
用户头像

发布了 95 篇内容, 共 29.9 次阅读, 收获喜欢 71 次。

关注

评论 1 条评论

发布
用户头像
现在产业互联网或工业 4.0 比较热,有兴趣从互联网行业投身到传统行业的朋友们要有这种深入一线的决心,才能真正理解业务,找到技术的发力点...这个说的好。
2020 年 04 月 23 日 19:46
回复
没有更多评论了
发现更多内容

三步法解析Axios源码

执鸢者

前端 axios

架构师训练营第 1 期第九周总结

Leo乐

极客大学架构师训练营

Week5 - 技术选型 - 缓存,队列,负载均衡

evildracula

学习 架构

架构师训练营第 1 期 - 第 9 周学习总结

Anyou Liu

极客大学架构师训练营

第九周总结

alpha

极客大学架构师训练营

Week 9 设计秒杀系统

黄立

斐波那契查找

ilovealt

算法和数据结构

JVM垃圾回收及秒杀系统

天天向上

极客大学架构师训练营

第九周总结

fmouse

极客大学架构师训练营

架构师训练营第 1 期第九周作业

Leo乐

极客大学架构师训练营

关于开发排期

张明森

架构师训练营第 1 期 - 第 9 周课后练习

Anyou Liu

极客大学架构师训练营

作业-第5周

arcyao

架構師訓練營第 1 期 - 第 09 周作業

Panda

架構師訓練營第 1 期

极客时间架构师训练营 1 期 - 第 9 周总结

Kaven

极客时间架构师培训 1 期 - 第 9 周作业

Kaven

架构一期第九周作业

Airs

Java核心基础——动态代理、静态代理

老农小江

java基础 代理模式

神经网络泛化

计算机与AI

神经网络 学习

首次排查 OOM 实录

AI乔治

Java 架构 OOM

架构师入门学习感悟五

莫问

极客时间架构师训练营 - 第五期作业

文江

第8周 作业2

Yangjing

极客大学架构师训练营

性能优化三第九周作业「架构师训练营第 1 期」

天天向善

微服务手册:分库分表从分析到实践,不再停留只会说分库分表

互联网应用架构

分库分表

native关键字作用到底是什么?

秦怀杂货店

Java 源码 源码刨析 native

第九周作业

fmouse

极客大学架构师训练营

第九周作业

alpha

极客大学架构师训练营

架构师第2期第5周作业一

老坛酸菜

极客大学架构师训练营

架构师训练营第五周作业

丁乐洪

这种算法都看不懂!9张图是如何展示出来的

周老师

Java 编程 程序员 架构 面试

从 Google 回来的 CTO-InfoQ