很荣幸参加了 5.24 上午由蚂蚁集团策划的“开源生态构建与基础软件技术开源项目”交流活动。
这次交流会主要是从开源生态构建与基础软件技术开源项目出发,结合国际经验与蚂蚁实践,探讨如何通过开源培养技术人才、构建活跃的技术生态,并提升关键软件技术的创新升级。
Linux 基金会亚太区开源布道者主席李建盛老师介绍了“开源的价值与中国开源现状”,李建盛老师在谈开源理解的时候,提到了两点,一是开源理念对财产所有权带来的变化,对商业模式产生了挑战,专用软件卖的不是软件,是使用权。而开源是对于原来这种所有权的恢复,一种新时代的新认知。过去 40 年证明了开源这种运动能活下来,并在社会上发生很重要的作用。
另外一个具有挑战的事是组织管理方式,来自互联网虚拟这种组织结构,其激励模式、合作方式、权利分配、利益分配,所有这些都给我们所有人启示和挑战。就像所有公司一样,基于项目的共同体其实相对来说也成功不多,但是那些成功比如说 Linux,它是给了我们新的启示,这是一个我们需要去学习和可以注意的地方。基于相同兴趣或者一些相同理念组织成虚拟共同体,这是前所未有的合作模式,可以让两个身处不同角落的人可以协作,是非常神奇的。
开源能够解决很多问题,而它又是基于开放透明的原则,从商业的角度来讲是构建 Trust 的非常重要原则,开源就是非常重要构建商业模式的基础。
蚂蚁集团开源委员会主席,基础设施委员会主席何征宇介绍了“蚂蚁开源理念与核心开源项目”,从整个软件行业来看,基础软件这个领域和开源有非常大的关系,首先大家耳熟能详一些技术软件像操作系统、中间件、数据库,这些东西是作为基础软件的代表,支撑了整个数字经济行业,不管是数字产业化或者产业数字化,里面都有这些软件的身影。未来,像人工智能或者工业互联网、IoT 等新的智能应用场景,也离不开基础软件。
中国基础软件发展和开源实际上和开源也是紧密相关的,整体来看,基础软件和平台软件、应用软件最关键的区别是落地的难度,也就是说有多少人用。基础软件之所以基础,就是它要被大量的应用场景所锤炼,基础软件核心问题就是必须要在千万级用户市场上才有可能发展壮大,市场是必要条件,但还不充分。
目前国内基础软件的难点在于,市场小,而美国生产一个软件,天然就拥有了全世界的市场,中国生产一个软件首先是在中国市场内。
我们现在要做什么事情呢,到国际游戏规则中,去捍卫中国软件在国际社群里的话语权。
目前很多通讯企业在讲 5G 标准、6G 标准,我们在和国际大企业竞争。
在软件行业,我们跟通信领域一个巨大区别除了有 RETF 标准化组织以外,开源组织除了几个开源大基金会,其实某种意义上来说也是一个标准,实际上我们在国际技术标准主导权上是缺失的。
这个缺失背后,也暴露了另一个问题,那就是人才的吸引、人才培养上的短板。虽然中国有大量的工程师红利,但是真正的工程师红利如何转向高质量的软件红利,或者占领一定的国际技术标准,这里有巨大的 Gap。
第三个挑战是,我们整个生态配套是比较弱的,在谈核心高级技术的同时,也要看核心周围的配套,缺少配套设施,再核心东西也无法到场景里面发挥作用。
针对这些场景问题,蚂蚁集团的主张是:
第一,蚂蚁前十年在闷头写代码,也写了很多开源项目和工具,例如 Ant Design,这只是冰山一角,蚂蚁实质上已经有 1600 多个开源仓库,社区头部项目有一百多个。
第二,提升社会对开源的认知,开源某种意义上是一个投影,是技术能力在社会上或者在社群里的投影。成立开源委员会实际上也是想尝试解决上述问题,包括行业问题,包括蚂蚁自身的问题,就是立足这两个基本点去推动不仅是蚂蚁内部开源软件发展,也包括这个行业的发展。
现在整个行业社会就是处于数字化转型的转折期,蚂蚁在帮助商家数字化过程中实际也发现一些问题或者有一定积累,这些积累帮助我们发现抽象出来几个大的问题,不仅八千万商家还有蚂蚁很多 ToB 服务,包括区块链、数据服务等等,就是一些共性问题。
蚂蚁最擅长的是安全可信,对金融行业来讲这很关键,数字化最怕的是没有枉法的数字世界,所以安全可信能力是蚂蚁在技术投资过程中一直非常重视的东西,是我们基本立足点。
第二个就是效率问题,高效协作,达成共识,用数字化方法达成统一的目标。
蚂蚁最擅长解决问题,包括用 TuGraph 解决数据分析的问题,用隐私计算解决可信的问题,用区块链解决大工程协作或者互相认证的一系列问题。
蚂蚁整体对开源的期待,还是回到开源最本质的东西,蚂蚁愿意把代码分享出去,让大家一起看,一起修改,提高整个行业的活力,蚂蚁的发展得益于数字经济的快速发展,我们也希望能够通过蚂蚁共享和参与能够进一步提升或加快数字经济的过程。
蚂蚁集团隐语隐私计算总经理、隐语开源框架负责人王磊介绍了“用开源促进隐私计算技术的迭代成长”。隐语作为蚂蚁开源当中的一个框架,是蚂蚁开源下的一个技术产品。
隐语的产生背景,要从整个国家数据要素战略出发,数据作为生产要素,非常容易被复制、被拷贝,这样就不可避免在流通过程中存在安全以及用户隐私问题。
大体上可以把隐私计算分成两大类技术,一类是确保数据计算过程和安全的技术,一类是确保结果安全。什么是过程安全和结果安全?
这个图可以看到我们把多方融合计算做了抽象,刚开始是来自多方原始数据,他们汇聚到一个地方进行融合计算,最后输出结果。这里面可以看到它有两种锁,一种是空心的白色锁,这个锁其实是传统的系统安全或者网络安全解决问题,隐私计算过程其实是解决计算过程中这把实心锁,要确保计算过程中它是安全的,不会有任何的信息泄露。
传统计算安全可能是多方数据融合,我们会找第三方来去充当安全核心,但是在隐私计算里面就是要把对人的信任转化成对技术的信任。
第二个结果发布的安全性,在发布结果上需要去通过加噪声的方式,去解决通过计算结果反馈给原始信息的动作。
隐私计算能解决什么问题?它能够保护用户隐私,因为在计算过程中不会泄露任何信息。在结果中通过加噪方式可以做结果混淆,保护用户隐私,可以保护数据价值。因为所有计算过程可控的,数据可用不可见,数据无法复制,这样对企业或者机构或者有数据价值的公司,在数据使用过程中可以避免通过数据拷贝导致价值损失。
隐语是蚂蚁开源的可信隐私计算框架,它汇聚了七种计算技术,每一种技术都有长短板,通过这种技术汇聚,可以在不同场景中针对用户需求去采集不同技术方案,来解决更多的问题。
第二,隐私计算本身是安全属性非常强的技术,蚂蚁在安全方面有非常强的积累,隐语也是通过蚂蚁安全团队去做非常多安全测试,来保证安全产品能真正达到安全效果。
第三,隐语是一个多模块设计方案,通过这种模型可以让不同层级的人来进行贡献。因为隐私计算是集工程、AI 算法和安全多领域综合性技术,很少有某一个专家能够精通所有技术,隐语提供一个很好平台,可以让每一个类型的专家专注于自己的能力,把框架最后集成起来。
隐语为什么选择开源?从隐私计算行业来说,还是处于一个早期发展阶段,它面临着非常多的问题,一个是技术难、门槛高、场景少。但是通过开源希望能解决这些问题。
面对场景少这个难题,现在隐私计算真正能够规模使用的,其实就是营销、分控,但是从国家数据要素战略来看,它绝对不只这些场景,国家是希望数据能够真正发挥到赋能实体经济,助力整个经济发展的目的。因此蚂蚁是希望通过隐私计算的普及,能够让更多的行业了解隐私计算能做什么,从而能够去基于隐私计算,去发现更多的数据融合和数据赋能实体经济的场景。
最后非常希望整个社会能够一起参与到隐语的共建中,一起把隐私计算技术和隐私计算行业做起来。
评论