写点什么

腾讯朱雀实验室推出“隐形”水印,助力打击 AI 模型盗取行为

  • 2021-11-12
  • 本文字数:1126 字

    阅读完需:约 4 分钟

腾讯朱雀实验室推出“隐形”水印,助力打击AI模型盗取行为

随着人工智能行业的发展,AI 技术被大量应用到人们的生活中,而 AI 模型作为这些技术的载体,被广泛部署在云端。作为一种数字资产,AI 模型面临着被窃取的风险,其安全性愈发引起业界关注。


北京时间 11 月 11 日至 12 日,全球知名信息安全峰会 POC 2021 正式举办,腾讯朱雀实验室高级研究员 Mengyun Tang 和研究员 Tony 受邀参加,并进行了题为《Towards AI Model Security Protection(AI 模型的安全保护)》的分享。


在此次分享中,腾讯朱雀实验室展示了 AI 模型攻防实例,并提出了一种新的模型水印生成方法,这项技术可以防御多种模型窃取方式,并且对原模型的输出几乎不产生影响,为 AI 模型版权提供有效的保护。

AI 模型维权,取证是难点

    

AI 模型作为技术的核心载体,一旦被窃取,将可能使拥有该技术的企业或组织暴露在风险中。例如,某公司的 AI 模型被黑客恶意盗取后,黑客就可以复制该公司的业务,来抢占市场,获取间接经济利益,或者将模型出售给第三方,甚至勒索该公司,来获取直接经济利益。

    

在模型窃取方式中,代理模型攻击是一种典型的手段,它通过训练与原模型功能相似的代理模型来蒸馏原模型的知识——将原模型的输入作为其输入,原模型的输出作为其训练标签,并进行参数优化,不断拟合原模型的输出,最终达到窃取原模型知识的目的。


模型窃取流程

   

而在面对模型窃取攻击时,模型的原作者往往容易处于被动。因为攻击者并不直接接触原模型,所以原作者无法提供直接证据,证明被窃取的模型中含有自己的知识产权,而陷入维权困难的境地。因此,一旦模型窃取攻击泛滥,将为人工智能的发展带来更多挑战。

“隐形”水印,AI 模型版权保护新方法


针对上述问题,腾讯朱雀实验室结合最新的深度学习技术,推出了一套为 AI 模型提供保护的方法,即对疑似窃取模型进行“取证”,来证明该模型为“盗版”模型。

    

这套方法可以在预先防护阶段,生成肉眼不可见的水印,并将之添加到原模型的输出上,为原模型的输出“烙上”版权信息,同时,对原模型的输出几乎不产生影响。当 AI 模型被攻击时,其附带的水印也会被代理模型学习到,进而使得代理模型的输出中也含有该水印。

    

随后,通过经训练的提取器,可以从代理模型的输出中精准地检测到水印的存在,并将预先嵌入的模型版权信息进行高质量的还原,从而为模型原作者提供有力的技术证据,来对抗侵权行为。


朱雀实验室提出的模型水印生成方法及其保护流程


这项技术为 AI 模型提供了一道“胎记”,其意义在于,不仅能够有效地帮助 AI 模型作者维护自己的知识产权,还能打击“盗版”AI 模型,一定程度地遏制模型窃取行为的发生,促进 AI 行业的生态持续健康发展。

    

腾讯安全平台部下属的腾讯朱雀实验室,致力于实战级 APT 攻击和 AI 安全研究,其建设的 AI 安全威胁风险矩阵,专门针对人工智能行业中的潜在风险提供研究和预案,为 AI 业务提供安全保障。

2021-11-12 16:104737

评论 1 条评论

发布
用户头像
会不会导致一些莫名其妙的BUG?
2021-11-23 08:42
回复
没有更多了
发现更多内容

ElasticSearch 分组统计(逗号分割字符串/nested集合对象)

alexgaoyh

elasticsearch 分组查询 聚合查询 逗号分割 nested

AI黑云压城,程序员真的没有未来了吗?| 社区征文

bug菌

三周年征文

华中科技大学网络空间安全学院正式加入openGauss社区

肝完阿里最新Java并发编程全优笔记,我成功晋升公司架构组

三十而立

Java java面试

本周最火AutoGPT!GitHub3.6万+标星,解决复杂任务全程无需人类插手

Openlab_cosmoplat

人工智能 GitHub 开源社区 autogpt

openGauss 5.0.0版本正式发布!

openGauss社区用户委员会工作会议顺利召开

REST API 设计规范:最佳实践和示例

Apifox

程序员 协议 API 接口开发 REST API

除了价格降70%,关于对象存储预留空间你还需要了解这些

云布道师

云存储

通过alter table 来实现重建表,同事大呼开眼界了

架构精进之路

MySQL 数据库· 三周年连更

直播|StarRocks 3.0 极速统一的湖仓新范式

StarRocks

大数据 开源 数据湖 #数据库 湖仓一体

openGauss加入 CNCF Landscape

艾融软件正式加入openGauss社区

艾融软件正式加入openGauss社区

openGauss数据库源码解析系列文章——SQL引擎源码解析(一)

不会吧?该不会还有企业没实现员工赋能吧!绝对是你没选低代码的问题!

加入高科技仿生人

知识管理 低代码 系统开发 员工赋能

openGauss社区三月运作报告

二极管/三极管/MOS管的封装类型,看这一篇就够了!

元器件秋姐

科普 封装 三极管 元器件 二极管

openGauss加入 CNCF Landscape

云数据库技术沙龙4月22日在杭州举办!

数据库小组

MySQL 阿里云 字节跳动 Clickhouse 玖章算术

别再吐槽公厕了!杭州智慧公厕解决方案带来惊喜

光明源智慧厕所

智慧城市

江苏智慧公厕:让厕所成为城市新名片

光明源智慧厕所

智慧园区

2023面试到底有多难?大厂为何都注重算法?我们该如何应对?

程序知音

Java 面试 算法 数据结构与算法 后端技术

来用友BIP技术大会,一同见证IT组织从传统运维向价值运营大转变

用友BIP

技术大会 用友iuap 用友技术大会 升级企业数智化底座

白嫖!字节跳动 Java岗顶级面试解析(2023版),GitHub巅峰神作!

三十而立

Java java面试

便捷高效,Notion AI比ChatGPT更加香!

南城FE

人工智能 AI 前端 ChatGPT

讲真,这次文档页升级我们用心了

百度开发者中心

百度地图

人工智能基础数据服务,第一!

百度开发者中心

人工智能 云宇宙 百度文心一言

ElasticSearch 自定义相似度插件-根据命中数排序

alexgaoyh

elasticsearch 自定义插件 相似度算法 词频排序 命中数排序

云和恩墨大讲堂 x 长江鲲鹏 x openGauss Meetup(武汉站)圆满落幕!

腾讯朱雀实验室推出“隐形”水印,助力打击AI模型盗取行为_AI&大模型_InfoQ编辑部_InfoQ精选文章