在大数据时代,基于大数据的应用,给日常生活、经济发展、城市治理等带来了极大的便捷。同时,用户隐私也面临着可能无处不在的“算计”,如何享受数据价值带来的利好并保护隐私,正成为当下热议的话题。
矛与盾:数据的开放应用与数据的隐私安全保护
一系列与“隐私数据”有关的事件在最近接二连三的出现在眼前。
蚂蚁金服和旷视关于“提供数据供对方训练算法”紧急公关,背后是人们对于“人脸数据”安全的关注。
苹果 iOS 14 内测版的推出,其中变化最大的就在于隐私保护新功能。比如 App 用于广告目的的用户追踪将需要获得用户批准等等。对于移动互联网中将追踪用户行为展开精准营销、定向投放的公司而言,无疑是个巨大的“打击”。
Tiktok 美国事件背后更是说不清道不明的用户“隐私数据”问题。
“隐私数据”备受关注的同时,也引起了多方对于“隐私数据”的思考。
数据计算后所产生的价值是不可估量的。对大数据应用或人工智能企业来说,合理边界和方式使用用户数据,已成为从企业到产业乃至整个社会发展的核心驱动力。
但保护“隐私安全”同样迫切。就像熵增科技创始人杨更曾说的,隐私就是我们故意要保持的信息不对称。一个没有隐私的人,相比一个有隐私的人是处于劣势的。而保护隐私能让个人处于更加公平的大环境中。
要让数据保持隐私安全不难,不收集、不去使用即可做到。但要推动数据作为生产要素产生价值和贡献,看似是盾与矛的关系,该如何化解?
既与又:隐私安全计算成为“唯一技术解”
中国科学院院士鄂维南曾在公开演讲中表示,数据作为一种特殊的资源,需要流动起来才能产生价值。不过,这种流动不是数据本身的共享,而是“数据价值”的流动,实现数据“可用不可见“。既能满足数据流动需求,又能保护数据与隐私安全。
因此需要一个“转换器”来实现数据安全和应用开放的“既与又”。隐私安全计算被认为是当下完成这一使命的“唯一技术解决”,是一门数据提供方不泄露原始数据和不泄露计算算法的前提下,对数据进行分析计算并能验证计算结果的信息技术。
隐私安全计算本身并不是一个单一技术,基于不同的信任假设和应用场景可以选择出适配相应条件的技术,括如基于硬件的 TEE、基于密码学的安全多方计算(MPC)和全同态加密(FHE)、源自人工智能的联邦学习等等,实现“数据价值”的共享。
国内已经涌现出一批以隐私安全计算为核心技术的企业。相关企业正通过隐私安全计算实现数据流通:数据不出平台,只在平台内授权使用,只输出数据的结果。
数据要素市场的建立应该成体系和规模,应该通过生态进行快速搭建。
总的来说,影响“隐私安全计算”转换数据价值共享效率有两大因素——技术和生态。技术是通向“数据价值共享”的工具,生态是繁荣“数据价值共享”的关卡。
术与器:隐私安全计算是否可以“挑大梁”?
隐私安全计算的方法论与产品目前在市场上获得了强烈的反响,在 2020 年更是被称之为“隐私计算元年”。这其中有政策利好,如数据资源正成为与人力资源、自然资源同样重要的第三类资源。数据也跟土地、劳动力、技术、资本等一样被当作生产要素写进了国家文件中。大数据应用在行业和国家和社会层面都意义重大。
其中也有数据应用的实践,如疫情下的绿码就是数据和算法的产物。
要实现行业和国家层面的大数据“繁荣和普惠”,首先跨过“日益增长的个人隐私保护需求和不平衡不充分的个人隐私保护能力之间的矛盾”这道坎,这也让“隐私安全计算”成为大数据时代最重要的护航手。具体表现在以下方面。
1、技术突破+场景落地,打破“孤岛”
而在整个数据流的生态中,其参与角色可以简单概括为数据提供方、数据使用者、数据服务方和管理方。而在加入生态前,往往因为没有互联互通而形成各类孤岛。
通过技术连接上下游,决定数据价值的潜能上限。而场景落地则是决定数据价值能力的展现。
2、场景率先落地,标杆力量推动行业发展
客观来说,当下大数据应用还处在最原始的阶段。从行业经济发展层面到国家城市治理层面,大数据、云计算、人工智能等新技术的运用,都形成产业推动的趋势发展。但数据安全是悬在头顶的“达摩克利斯之剑”,又让“数据开发”面临挑战。
比如各地各级政府都拥有海量数据。若能利用好手中的大数据,无疑可在社会治理、经济发展、服务百姓等更进一步。如果平台能够保证数据安全,政府自然乐见加速“数据开发”。
总之,在大数据时代,数据给科学研究、社会发展和经济发展提供了坚强后盾。而随着大数据、云计算、人工智能等新技术的运用,对数据的挖掘将越来越深。在保护数据安全和促进数据生态良性发展的道路,隐私安全计算的担子也将“越来越重”,是机遇,更是挑战。
评论