因涉嫌窃取谷歌 AI 商业机密,中国籍谷歌工程师在美被捕
据美国司法部网站信息,日前,美国联邦政府对华人工程师 Linwei Ding(又名 Leon Ding)提起四项商业机密盗窃罪名,指控其涉嫌意图从谷歌公司处窃取与 AI 技术相关的专有信息。3 月 5 日,Linwei Ding 在加利福尼亚州纽瓦克当地被捕。
如果罪名成立,Linwei Ding 将面临最高 10 年监禁及每项罪名最高 25 万美元(约 180 万元人民币)的罚款,联邦地区法院法官将在参考美国量刑指南及其他法律因素后做出判决。目前,联邦调查局与商务部正在联手调查此案。
起诉书显示,Linwei Ding 今年 38 岁,为中国公民、加利福尼亚州纽瓦克居民。根据公布的法庭文件,Linwei Ding 涉嫌窃取的技术涉及谷歌先进超级计算数据中心的构建模块,该数据中心专门用于支持大型 AI 模型训练和托管中的机器学习类工作负载。从起诉书看来,该大型 AI 模型能够理解细微的语言表达差别,属于能针对提示词、任务或查询生成智能响应的 AI 应用。
起诉书还描述了谷歌如何开发其专有硬件和软件,进而推动由其超级计算数据中心支持的机器学习过程。在硬件方面,谷歌采用了先进的计算机芯片,具备支撑机器学习并运行 AI 应用所需要的卓越处理能力。而在软件方面,谷歌部署有多层软件,起诉书将其称为“软件平台”,旨在有效协调机器学习工作负载。
例如,该软件平台的组件之一为集群管理系统(CMS),由其充当谷歌超级计算数据中心的“主脑”。CMS 负责为整个硬件基础设施进行任务组织、优先级排序和具体分配,从而确保各先进芯片能够以高效方式执行机器学习工作负载或托管 AI 应用程序。
美国司法部长 Garland 表示,“司法部不会容忍对 AI 乃至其他任何可能危及我们国家安全的先进技术实施盗窃。在本案中,我们指控被告在秘密为两家中国企业工作期间,窃取了谷歌的 AI 相关商业机密。我们将努力保护美国开发的敏感技术,避免这些技术落入错误的人手中。”
该工程师号称是“全球能搭建万卡级算力平台的十人之一”
起诉书提到,谷歌于 2019 年聘请 Linwei Ding 担任软件工程师,其工作职责包括开发谷歌超级计算数据中心内部署的软件。正式入职之后,Linwei Ding 获得了访问谷歌机密信息的权限,具体内容涉及硬件基础设施、软件平台及其所支持的 AI 模型与应用程序。
此外,起诉书还指控 Linwei Ding 秘密与两家中国科技企业有所关联。从内容来看,Linwei Ding 曾在 2022 年 6 月 13 日左右收到来自中国某早期科技公司 CEO 的几封电子邮件,其中提到 Linwei Ding 已被任命为该公司首席技术官。据称 Linwei Ding 于 2022 年 10 月 29 日回到中国,并逗留至 2023 年 3 月 25 日。在此期间他参加了为新公司筹集资金的投资者会议。起诉书提到,各准投资方被告知 Linwei Ding 担任新公司首席技术官,而且掌握着公司 20%的股权。
起诉书同时指出,在谷歌不知情的前提下,Linwei Ding 于 2023 年 5 月 30 日前创立了自己的 AI 与机器学习科技企业,并担任公司 CEO。Linwei Ding 的这家公司宣称将开发一套软件平台,旨在加快机器学习类工作负载的运行速度,包括大型 AI 模型的训练速度。根据起诉书所言,Linwei Ding 曾申请中国的初创企业孵化计划,并于 2023 年 11 月 24 日前往北京,在投资者会议上介绍了这家企业。而且与 Linwei Ding 初创公司相关的一份文件也提到,“我们拥有谷歌万卡级算力平台的管理经验;只需照搬并加以升级,就能进一步开发出适合中国国情的算力平台。”
起诉书强调,Linwei Ding 的行为违反了雇佣协议以及其在入职谷歌时签署的单独行为准则。此外,起诉书也解释了 Linwei Ding 为隐瞒其商业机密窃取行为而采取的措施。
例如,Linwei Ding 疑似将谷歌源文件中的数据复制到公司配发给他的 MacBook 笔记本上的 Apple Notes 应用程序当中。随后,Linwei Ding 将 Apple Notes 转换为 PDF 文件,又将其通过谷歌网络上传至独立账户。据称 Linwei Ding 避开了谷歌数据丢失防护系统的检测。此外,起诉书还描述了 Linwei Ding 在 2023 年 12 月如何把自己的工牌出借给另一位谷歌员工,使其顺利打卡并进入谷歌办公大楼。打卡记录显示 Linwei Ding 似乎仍在出入办公地点,但他当时实际上人在中国。
美国司法部国家安全部门助理总检察长 Matthew G. Olsen 表示,“Linwei Ding 涉嫌策划从谷歌处窃取顶尖 AI 技术,同时与中方竞争企业秘密接触并接洽业务。”美国检察官 Ismail Ramsey 提到,“Linwei Ding 在谷歌担任软件工程师期间,曾秘密为个人及两家位于中国的企业谋取利益。通过窃取谷歌关于 AI 超级计算系统的商业机密,Linwei Ding 为他本人及归其名下的两家中国公司带来不公平的竞争优势。”
根据国内社交媒体上挖掘的信息,Linwei Ding 极有可能是融数联智 CTO、至算科技 CEO 丁林葳。
根据介绍,丁林葳毕业于美国南加州大学,曾任谷歌主任工程师/异构计算研发负责人,是全世界能搭建万卡级算力平台的十人之一。领导 GPU 和 TPU 等加速器的系统设计和开发,以及 Pathways 和 Jax 的系统框架的开发。其团队开发了所有云服务的加速器系统,以及基于超级计算机来研发 LLM 大规模语言模型。丁林葳曾在谷歌搭建的万卡级算力平台,正在被 Google Research、 Anthropic、DeepMind 和 OPEN AI 所使用。
丁林葳任职的两家公司中,融数联智成立于 2019 年,专精于隐私计算,公司拥有自主研发的隐私保护芯片、多方安全计算软件系统、AI 联邦学习平台、可信计算 TEE 以及隐私计算一体机,为客户构建合法高效的数据协同链提供技术保障,助力数据在机构之间“可用不可见”的流通和融合应用,保障数据合作和数据流通的全链条安全,为数据要素发挥价值提供技术驱动。
至算科技是国内唯一最早推出单任务万卡级的大算力 AI 训练推理加速算力平台的公司,从底层系统上解决“国内做不了 50B 以上大模型”的痛点。信息显示,该项目创始人(丁林葳)曾在谷歌带队做出的 6 万卡 TPU、2.6 万 GPU 万卡级算力平台。本项目支持的算力规模可达单任务万卡,支持大模型训练时长从月级可降至小时级。
将谷歌技术机密上传至谷歌网盘,网友:事情绝不简单
起诉书提到,2022 年 5 月 21 日,Linwei Ding 开始将机密信息复制至个人 Google Cloud 账户,秘密上传保存在谷歌网络内部的商业机密。之后 Linwei Ding 持续定期上传,直到 2023 年 5 月 2 日,期间 Linwei Ding 共上传了 500 多个包含机密信息的独立文件。
美国司法部副部长 Lisa Monaco 表示,“在我们努力以负责任的方式发挥 AI 积极价值的同时,司法部也对其风险保持着高度警惕,包括可能对我们国家安全造成的全面威胁。从今天的指控来看,被告从谷歌公司处窃取到 500 多个包含 AI 商业机密的保密文件,同时也秘密在为希望取得 AI 技术竞赛领先优势的中国企业工作。司法部将不懈追查那些将颠覆性技术成果(特别是 AI)非法传出境外的人,并追究其责任。”
有网友质疑,“将谷歌技术机密上传至谷歌网盘”这一操作并不符合“窃密思维”,反而更像是正常的日常工作。有网友评论称,“不离职就只是工作,离职就是窃密”,也有网友将其归类于“阴谋论”:“内部技术人才辞工,不能把人才流去其他地方公司,然后找点所谓的证据,只有坐牢了就不会把前公司的技术泄露出去了”。
目前,关于该案只有美国司法部一面之词,当事人还未回应。值得一提的是,起诉书本身仅为涉案指控,被告在被法庭证明有罪之前,面临的一切指控均遵循疑罪从无原则。
参考链接:
评论