写点什么

数据合规、海外部署、基础设施差异化……如何建设稳定高效的全球化技术能力?

  • 2023-02-27
    北京
  • 本文字数:5781 字

    阅读完需:约 19 分钟

数据合规、海外部署、基础设施差异化……如何建设稳定高效的全球化技术能力?

导语:


如果将全球化比作一场航行,每个期望走出去的企业都是水手,那么是造一艘属于自己的船,还是搭乘已有的船呢?在不同的时间和场景下,相信每个水手都有自己的答案。


近几年,在国际政经环境复杂变幻的形势之下,中国企业出海的格局和挑战发生重大改变,企业出海既要兼顾不同地区的数据合规,也要关注成本和效率。面对上述变化,如何建设稳定高效的全球化技术能力?针对本对本和跨境两种业务模式,该如何选择和部署架构……InfoQ 专访阿里集团全球化业务平台团队负责人李伟杰,试图探寻上述问题的答案。  


1999 年阿里巴巴创立之初,阿里集团的全球化就已经开始。同年,阿里创建了集团第一个业务单元 ——Alibaba.com 即全球化业务,后续在 2010 年正式上线的 AliExpress 标志着阿里的全球化走向 To C 时代。正是这个时期,李伟杰加入阿里,成为了全球化技术团队的一员。


从 2017 年起,阿里陆续收购 Lazada、Daraz、Trendyol 等海外公司,阿里全球化业务布局初步形成。自此,阿里正式将全球化技术作为集团重要的技术战略方向来投入。

全球化技术体系演进及全球化业务平台建设


在全球化业务布局的过程中,阿里发现中国企业出海主要面对四个维度的差异和挑战,分别是:语言、文化、地域、监管。


语言维度不必多说;文化方面,用户和文化特征上的差异会投射到技术能力的要求上,比如,很多国家禁限售的东西不一样,这就需要商品的差异化透出;地域方面,海外电商服务的对象大部分场景是跨国家的,而海外不同国家的网络性能和基础硬件设施和国内相比有很多差异,这对业务的稳定性和体验的流畅度提出了很多挑战;另外在监管方面,不同国家、不同区域的政策和合规要求不一样,监管更是堪称基础底线的问题,必须要严格注意。这些都促使阿里必须演进新的或更合适的技术体系。


举例来说,用户从发起请求到接收到响应的延时越短,代表技术体系的性能越好。而全球互联网服务在延时上有天然的挑战,即物理距离更长,机房可能在美国,而用户可能在澳大利亚。阿里的测试数据显示,美国用户请求美国互联网服务一般的网络 RTT 是 10ms 以内,而德国用户请求美国西部机房的 RTT 在 150ms 到 300ms 之间不等,这直接导致用户的全屏加载时间会多出 1 秒钟,而 1 秒钟会造成转化率下降,甚至是用户流失。


从 2017 开始的这轮全球化技术体系建设,经过五个阶段的演进,逐渐发展成为阿里巴巴集团内相对独立的技术体系。



  • 第一阶段:基于国内淘宝、天猫、搜推等团队的系统,用 6 个月的时间搭建了全套支持 Lazada 的新电商内核系统,这是阿里集团重兵投入全球化的标志性事件。

  • 第二阶段:基于第一阶段的电商内核系统进行相应定制,搭建了全套支持 Daraz 的新电商系统。

  • 第三阶段:将这套电商内核和 AE 系统进行了深度融合,同时引入了淘宝、天猫等团队的优秀系统解决方案,形成了可同时支持本地 + 跨境交易模式的全球化业务平台的雏形,以更标准化的方式做向上的服务和支撑,帮助业务在发展的过程中少做低水平的重复建设。

  • 第四阶段:进一步标准化,以上述融合版本为基础,合并 Lazada、Daraz、天猫淘宝海外,完成全球化业务平台技术分支的 4 合 1 动作,最终形成了现在 1 个中台支撑 N 个站点的全球化新架构。

  • 第五阶段:全球化业务平台开源策略开始落地,到 2021 年 11 月完成中台全链路开源,全球化业务和中台各自闭环迭代局面形成,将中台做“薄”,给业务更多想象空间。


其中,阿里巴巴全球化业务平台的建设是至关重要的一环,李伟杰对其建设的必要性做了总结:


第一是节约研发资源,避免不同业务重复造轮子的低水平内部竞争;

第二是要将全球化业务形成合力,如国内商品能通过标准化的形式铺到海外,同时让不同地区的热门商品实现互通等,也就是商品、商家、业务等多方面的能力互通;

第三是体验的提升,在资源有限的条件下,避免重复造轮子,就能面向未来做更多的投入。

全球化电商业务模式差异和部署架构思考


在业务上,全球化电商主要有本对本和跨境两种最基本的类型。而针对本对本和跨境两种业务模式的选择,阿里多是基于对当地市场的潜力和能力判断


李伟杰介绍,东南亚是一个高潜成长地区,需要有更多的投入,因此选择了本对本的业务模式。东南亚电商品牌 Lazada 就是典型的海外本对本业务,主要实现在国外某国或地区,敏捷地构建一套支持本地买 / 卖家交易的电商系统。这样的模式,决定了商家大部分在海外国本地,币种会相对单一,运营能力需要更加本地化等等。


而像北美、南美、东欧、北非、中东等地,即使在本对本的业务模式下大规模投入,也要面临本地市场十分激烈的竞争。因此,阿里在这些地区采用了跨境的业务模式,其优势在于成本可控,能够快速建立口碑、品牌影响力以及消费者认知。在这期间,如果发现市场有潜力,还可以转为本对本模式。


跨境电商品牌 AliExpress 就是典型的跨境模式业务,主要实现中国商家能在中国货品优势下,通过阿里的系统将货物销售给跨境的买家,这里涉及的问题会大不相同。从语言、币种、时差、品类、活动、汇率差、物流、供应链等方面,阿里需要有种种差异的技术解决差异的问题。电商业务,主要由电商系统、支付系统、物流系统组成,这三大系统的国际技术实现和国内技术实现都有一定差异。


下面结合全球化的这两种业务模式,从部署架构、数据合规两个角度概要说明阿里全球化出海的技术探索


1. 区域化异地多活


AliExpress 的核心需求是电商的全球买 & 全球卖,要考虑用户就近访问的网络延时、容灾场景等。在多区域部署的场景以及核心需求的制约下,区域化部署的总体原则就很明确了,即不同于 Amazon 以及 Lazada 的本地站点模式,在数据合规的前提下不同区域之间需要尽量保障数据的一致性。比如,当来自不同区域的买 / 卖家进行交易时,需要保障共享数据的一致性;当异地容灾时,用户区域进行迁移后,也需要保障不同区域服务同一用户的一致性。


2. 本对本同城双活


不同于 AliExpress 的全球买卖业务,Lazada/Daraz 业务更聚焦在东南亚地区,采用的是本地买卖 Local to Local 模式,因此采用了本对本同城多活部署架构。


顾名思义,同城多活容灾建设就是在一个城市内的多个 IDC 进行灾备建设,目标是当一个 IDC 出现故障,能够快速切换至另外的 IDC 上,保证业务可用。采用多单元部署架构,借助单元化来实现单元内流量自闭环隔离,数据库使用 RDS 三节点企业版来保障其高可用性。一旦发现故障灾备,可以从入口流量、统一接入层等快速切换至另外的 IDC 上,保障业务可用。


3. 多租户架构


全球化业务的基本特点是多区域、多币种、多语言,为了实现经营策略精细化执行,基于这几个维度,可以确定业务经营单元,为了实现每个经营单元间的隔离和经营地域元数据标准化,需要提出面向业务经营区域的租户概念,而在技术架构层面,需要提供统一的面向多区域的租户架构标准。每个经营单元的业务体量、业务形态都存在一定的差异,所以从部署架构上可以提供租户的物理隔离和逻辑隔离两种形态,在技术架构上需要提供配置隔离、数据隔离、流量隔离能力,在租户定义上需要保持统一的租户模型。基于统一的租户建立经营单元和技术架构之间的映射关系,从而能够以租户实现经营单元维度的开发、测试、部署、运维等研发活动,降低研发活动过程中经营单元之间的耦合,提升经营单元的独立性。


4. 全球数据合规实践


全球化必须优先解决数据合规的问题,目前欧洲的 GDPR(General Data Protection Regulation,通用数据保护条例)是最严格的数据保护条例,大多数地区都将其作为范本。基于阿里业务的特征,数据合规成为了合规工作的重点。凡是涉及到数据处理的问题,都可以和数据合规相关,同时数据合规由于其监管的敏感性,对于平台来说属于业务熔断性风险。


根据个人数据封闭范围,阿里把跨境业务分为区域化架构方案、隐私数据封闭方案和个人数据封闭方案三种,本对本业务则采用独立单元封闭方案。


同时,数据合规层面经常会面临一个直接的监管要求:数据本地存储(不允许离境 or 本地留存备查)。某些敏感业务甚至存在更高的监管要求,即存在不允许使用公有云或者公有云资源高安全独立的情况,为此阿里也需要具备自建完整基础设施,以满足合规建站需求的能力。


除了严格遵循各国法律要求,通过定义合规架构,充分满足各国法律对业务合规的要求外,阿里每年都会完成各国合规的应答,通过合规架构来快速产出应答信息,整理出相关架构、容灾、数据同步链路等信息给到国家监管机构,保障合规要求。通过这些持续的迭代,为阿里海外业务合规水平的提升和业务平稳发展与拓展,提供了极大的帮助。


另外在合规商业化上,阿里也在考虑将多年沉淀的合规技术和产品(如面向 cookie 合规、面向数据合规、面向网络合规、面向进出口合规),通过阿里云提供给更多中国企业,帮助中国企业在出海过程中做好安全合规。

全球化技术体系的下一步落在哪?


李伟杰透露,阿里巴巴全球化技术体系的演进方向将是 Serverless 和智能化。


如今,Serverless 的稳定性和效率已经被逐渐接受,开始实现“由点到面”的转变。一方面,现在的 Serverless 架构可以解决微服务架构无法带来足够灵活度的问题,帮助企业快速适应业务变化;另一方面,Serverless 按实际用量计费的模式更加接近“电网”的模式,能够让云计算从一种资源真正变成一种能力。


虽然业内对于 Serverless 是云原生未来的重点方向没有太多分歧,但在落地上还处于艰难期。Serverless 不仅仅是一种技术,而是一种全新的架构,只要有一个环节不是 Serverless 的,这种模式就没有太大意义,因为还需要为这一个环节进行重新设计。阿里巴巴的全球化技术体系中涵盖了搜索、推荐、交易、导购等不同的模块,目前没有一个银弹(一套解决方案)能将全部模块 Serverless 化。对此,李伟杰表示目前有两个规划:一是划分不同的业务领域落地 Serverless 实践,并形成标准化,未来也可能将这些标准化的方案通过阿里云对外输出;二是做基础镜像和容器的标准化,虽然 Serverless 在业务层面无法抽象成一套体系,但在基础镜像和容器层面能够实现标准化


当云原生的底座逐步完善并开始进入精细化运营的时代,业界开始将 AI 的能力逐步引入整个技术体系中,云上的 AI 开发者服务已经成为软件工程团队必不可少的工具,进一步释放了运营人员的精力,并将系统带到更加标准化、智能化的层面。李伟杰表示,目前,阿里已经把一些 AI 能力引入到全球化技术体系之中,并将 AI 作为工具更充分地利用起来,构筑技术的先进性,让技术创造新商业,并拓展商业边界。


当然,全球化不仅仅是一个技术问题,更多的是一个战略决策,这其中还有很多值得进一步的探讨的话题。结合阿里巴巴全球化的经验,李伟杰也针对重点问题分享了自己的看法, 期望为行业带来可行的参考。

企业出海如何应对潜在的风险和问题?


InfoQ:出海企业在合规方面需要注意哪些问题?


李伟杰:首先要区分敏感度和优先级,研读 GDPR 会发现其涉及的要求非常广泛,我们要优先考虑用户感知最密切的 Cookie、个人数据删除等内容,在系统设计之初把这些功能规划好。


其次是数据本地存储的要求也需要在系统设计之初进行考量。其中用户的数据又可以划分出隐私域和其他,需要有针对性的数据合规设计和实现。


最后,还需要关注到合规对法务专业性的要求很高,需要由他们把需求和优先级整理出来,再给到后方的研发工程师等。因此建议中小企业可以找云厂商进行合作,云厂商可以在企业出海的数据存储、隐私域建设等方面给到有价值的建议。


InfoQ:电商出海,应该独立建站还是借船出海?


李伟杰:目前出海的国内电商企业,大多会做多渠道的布局,在不同渠道开设不同店铺,这样可以直接复用平台的技术能力、供应链能力等,可以快速启动,官方店则可能用独立站运营。我们在 Alibaba.com 上也孵化出了独立站的产品,给大家提供独立站的解决方案。


毕竟,做独立站的投入成本比较高,还需要自己解决合规、法律等问题,对中小规模的企业不是很划算。从全球化电商的角度来讲,电商的基础设施最终比拼两部分,第一部分是 B 端供应链的质量和效率,第二部分是面向 C 端消费者的洞察和理解


InfoQ:国内企业出海,哪些行业更受欢迎?


李伟杰:目前来看,中国企业出海比较受欢迎的是电商、短视频等中上层应用。同时,近两年讨论度比较高的 Web3 相关应用也比较热门,而像中间件这类底层基础设施,在海外市场的受认可程度并不高,对于做基础设施的企业来说,与云厂商抱团出海可能是一条比较好的路径。


业界对中国公司普遍认知是,中国中上层应用比海外的很多厂商做得更好,但在基础设施的先进性上与欧美仍有较大差距。以数据库为例,国外用户会天然认为欧美的技术相对更成熟,除非有一些使用的门槛或者 License 的要求,才会考虑中国的数据库。虽然国内的数据库在价格和服务方面也很有优势。目前这个阶段也是我们追赶先行者所必须经历的过程。


InfoQ:业界对中台的评价褒贬不一,“中台 + 开源”是建设全球化技术体系的合适方式吗?出海企业该如何正视中台?


李伟杰:比如那家芬兰游戏公司 Supercell,这家公司的员工人数不到 200 个人,但是一年的利润高达 15 亿美金。这样小规模的团队,如何做到这么大的业务?其中一个原因就是他们把游戏开发过程中,要用的一些通用游戏素材和算法整理出来,把这些作为工具提供给所有的小团队。受此启发,阿里集团正式提出了“大中台、小前台”的中台战略,将原本分散到各个业务的支持部门集中到一起。


目前大家对于中台有意见,主要原因是有些中台太“厚”了,把那些需要基于业务灵活拓展的东西也放进中台,希望它成为一个包含各种功能的 SaaS 软件来支撑灵活拓展的业务,这样就会很难用。而且中台建设对于人的抽象能力要求很高,目前以抽象归纳为主的中台能力定义方式在面对未来的业务不确定性时还有很多不足。


因此,合适的中台要先“薄”,或者先“薄”再“厚”,阿里摸索出的中台发展方向是提供更底层、更标准、更抽象、更通用的能力。在此基础上组建应用,再根据业务诉求和场景做编排和定制,形成全新的产品。此外,企业需要达到一定的量级再去做中台,对于中小企业而言,可以用中台思维来做技术抽象和沉淀,但是没有必要做中台。

写在最后


纵观阿里全球化体系的发展,“与时俱进”贯穿始末,不仅给业界沉淀了技术实践经验,也给出海企业提供了借鉴。当下,在全球化 4.0 的大背景下,面对新的技术趋势和需求,阿里全球化技术会如何帮助企业释放生产力?在智能化方向上会带来哪些新的应用和突破?我们共同期待。

2023-02-27 14:513893

评论

发布
暂无评论
发现更多内容

火山引擎数智平台ByteHouse入围稀土掘金《Top10年度创新产品》

字节跳动数据平台

大数据 云原生 Clickhouse

在vue的v-for中,key为什么不能用index?

bb_xiaxia1998

Vue

有哪些值得推荐的敏捷开发工具❓

没有用户名丶

面试官:能用JavaScript手写一个bind函数吗

helloworld1024fd

JavaScript

预告| 2月24日不见不散!开源治理专场约定你

OpenI启智社区

人工智能 开源社区 开发者大会 开源治理 OpenI启智社区

React源码分析6-hooks源码

goClient1992

React

每日一题之Vue数据劫持原理是什么?

bb_xiaxia1998

Vue

一台不容错过的Java单元测试代码“永动机”

京东科技开发者

Java 单元测试 京东云 京东技术

云原生观测性--OpenTelemetry 之实战篇

Daocloud 道客

云原生 可观测性 OpenTelemetry

面试官:请实现Javascript发布-订阅模式

helloworld1024fd

JavaScript

预告| 亮点抢先看!第四届OpenI/O启智开发者大会主论坛24日启幕!

OpenI启智社区

人工智能 开发者大会 算力网络 OpenI启智社区

React源码分析7-state计算流程和优先级

goClient1992

React

即刻报名!飞桨黑客马拉松第四期如约而至,等你挑战

飞桨PaddlePaddle

深度学习 paddle 开源 大赛 飞桨

一图读懂阿里云RDS架构与选型

NineData

数据库 阿里云 Serverless RDS arm

Hadoop 及Spark 分布式HA运行环境搭建

京东科技开发者

大数据 hadoop spark 后端 企业号 2 月 PK 榜

软件测试/测试开发 | App常见bug解析

测试人

软件测试 自动化测试 测试开发 app测试

百度工程师浅谈分布式日志

百度Geek说

分布式 运维 日志 百度文库 企业号 2 月 PK 榜

混沌工程之 ChaosBlade 故障注入百宝箱

柠檬汁Code(binbin0325)

源码分析 混沌工程 故障注入 ChaosBlade Chaos

听说 ChatGPT 推荐了一场技术活动,就在本周六的北京?

Daocloud 道客

北京 技术活动

滴滴前端一面常考手写面试题合集

helloworld1024fd

JavaScript

镇江有具有资质的等保测评机构吗?在哪里?

行云管家

等保 等级保护 等保测评 镇江

NFT链游开发实现DAPP系统落地

薇電13242772558

NFT 链游

优质的双机热备软件厂家是哪家?咨询电话多少?

行云管家

高可用 双机热备 双机热备软件

实践篇(三):如何有效评审软件架构图?

京东科技开发者

架构 后端 软件架构 企业号 2 月 PK 榜 架构评审

云业务成本的组成与管理趋势

SEAL安全

云服务 云成本 FinOps 企业号 2 月 PK 榜

社招前端一面必会vue面试题

bb_xiaxia1998

Vue

美团前端常考手写面试题总结

helloworld1024fd

JavaScript

React源码分析5-commit

goClient1992

React

高级前端二面必会vue面试题合集

bb_xiaxia1998

Vue

基金行业,镭速文件传输系统方案

镭速

别错过!4C首发直播,上届全国总冠军带你入门赛题

飞桨PaddlePaddle

计算机 飞桨 PaddlePaddle

数据合规、海外部署、基础设施差异化……如何建设稳定高效的全球化技术能力?_文化 & 方法_任传英_InfoQ精选文章