写点什么

谷歌华人工程师被捕:号称“全球能搭建万卡级算力平台的十人之一”,在国内两公司担任 CTO、CEO

  • 2024-03-08
    北京
  • 本文字数:2957 字

    阅读完需:约 10 分钟

大小:1.44M时长:08:23
谷歌华人工程师被捕:号称“全球能搭建万卡级算力平台的十人之一”,在国内两公司担任CTO、CEO

因涉嫌窃取谷歌 AI 商业机密,中国籍谷歌工程师在美被捕

 

据美国司法部网站信息,日前,美国联邦政府对华人工程师 Linwei Ding(又名 Leon Ding)提起四项商业机密盗窃罪名,指控其涉嫌意图从谷歌公司处窃取与 AI 技术相关的专有信息。3 月 5 日,Linwei Ding 在加利福尼亚州纽瓦克当地被捕。

 

如果罪名成立,Linwei Ding 将面临最高 10 年监禁及每项罪名最高 25 万美元(约 180 万元人民币)的罚款,联邦地区法院法官将在参考美国量刑指南及其他法律因素后做出判决。目前,联邦调查局与商务部正在联手调查此案。

 

起诉书显示,Linwei Ding 今年 38 岁,为中国公民、加利福尼亚州纽瓦克居民。根据公布的法庭文件,Linwei Ding 涉嫌窃取的技术涉及谷歌先进超级计算数据中心的构建模块,该数据中心专门用于支持大型 AI 模型训练和托管中的机器学习类工作负载。从起诉书看来,该大型 AI 模型能够理解细微的语言表达差别,属于能针对提示词、任务或查询生成智能响应的 AI 应用。

 

起诉书还描述了谷歌如何开发其专有硬件和软件,进而推动由其超级计算数据中心支持的机器学习过程。在硬件方面,谷歌采用了先进的计算机芯片,具备支撑机器学习并运行 AI 应用所需要的卓越处理能力。而在软件方面,谷歌部署有多层软件,起诉书将其称为“软件平台”,旨在有效协调机器学习工作负载。

 

例如,该软件平台的组件之一为集群管理系统(CMS),由其充当谷歌超级计算数据中心的“主脑”。CMS 负责为整个硬件基础设施进行任务组织、优先级排序和具体分配,从而确保各先进芯片能够以高效方式执行机器学习工作负载或托管 AI 应用程序。

 

美国司法部长 Garland 表示,“司法部不会容忍对 AI 乃至其他任何可能危及我们国家安全的先进技术实施盗窃。在本案中,我们指控被告在秘密为两家中国企业工作期间,窃取了谷歌的 AI 相关商业机密。我们将努力保护美国开发的敏感技术,避免这些技术落入错误的人手中。”

该工程师号称是“全球能搭建万卡级算力平台的十人之一”

 

起诉书提到,谷歌于 2019 年聘请 Linwei Ding 担任软件工程师,其工作职责包括开发谷歌超级计算数据中心内部署的软件。正式入职之后,Linwei Ding 获得了访问谷歌机密信息的权限,具体内容涉及硬件基础设施、软件平台及其所支持的 AI 模型与应用程序。

 

此外,起诉书还指控 Linwei Ding 秘密与两家中国科技企业有所关联。从内容来看,Linwei Ding 曾在 2022 年 6 月 13 日左右收到来自中国某早期科技公司 CEO 的几封电子邮件,其中提到 Linwei Ding 已被任命为该公司首席技术官。据称 Linwei Ding 于 2022 年 10 月 29 日回到中国,并逗留至 2023 年 3 月 25 日。在此期间他参加了为新公司筹集资金的投资者会议。起诉书提到,各准投资方被告知 Linwei Ding 担任新公司首席技术官,而且掌握着公司 20%的股权。

 

起诉书同时指出,在谷歌不知情的前提下,Linwei Ding 于 2023 年 5 月 30 日前创立了自己的 AI 与机器学习科技企业,并担任公司 CEO。Linwei Ding 的这家公司宣称将开发一套软件平台,旨在加快机器学习类工作负载的运行速度,包括大型 AI 模型的训练速度。根据起诉书所言,Linwei Ding 曾申请中国的初创企业孵化计划,并于 2023 年 11 月 24 日前往北京,在投资者会议上介绍了这家企业。而且与 Linwei Ding 初创公司相关的一份文件也提到,“我们拥有谷歌万卡级算力平台的管理经验;只需照搬并加以升级,就能进一步开发出适合中国国情的算力平台。”

 

起诉书强调,Linwei Ding 的行为违反了雇佣协议以及其在入职谷歌时签署的单独行为准则。此外,起诉书也解释了 Linwei Ding 为隐瞒其商业机密窃取行为而采取的措施。

 

例如,Linwei Ding 疑似将谷歌源文件中的数据复制到公司配发给他的 MacBook 笔记本上的 Apple Notes 应用程序当中。随后,Linwei Ding 将 Apple Notes 转换为 PDF 文件,又将其通过谷歌网络上传至独立账户。据称 Linwei Ding 避开了谷歌数据丢失防护系统的检测。此外,起诉书还描述了 Linwei Ding 在 2023 年 12 月如何把自己的工牌出借给另一位谷歌员工,使其顺利打卡并进入谷歌办公大楼。打卡记录显示 Linwei Ding 似乎仍在出入办公地点,但他当时实际上人在中国。

 

美国司法部国家安全部门助理总检察长 Matthew G. Olsen 表示,“Linwei Ding 涉嫌策划从谷歌处窃取顶尖 AI 技术,同时与中方竞争企业秘密接触并接洽业务。”美国检察官 Ismail Ramsey 提到,“Linwei Ding 在谷歌担任软件工程师期间,曾秘密为个人及两家位于中国的企业谋取利益。通过窃取谷歌关于 AI 超级计算系统的商业机密,Linwei Ding 为他本人及归其名下的两家中国公司带来不公平的竞争优势。”

 

根据国内社交媒体上挖掘的信息,Linwei Ding 极有可能是融数联智 CTO、至算科技 CEO 丁林葳。

 




根据介绍,丁林葳毕业于美国南加州大学,曾任谷歌主任工程师/异构计算研发负责人,是全世界能搭建万卡级算力平台的十人之一。领导 GPU 和 TPU 等加速器的系统设计和开发,以及 Pathways 和 Jax 的系统框架的开发。其团队开发了所有云服务的加速器系统,以及基于超级计算机来研发 LLM 大规模语言模型。丁林葳曾在谷歌搭建的万卡级算力平台,正在被 Google Research、 Anthropic、DeepMind 和 OPEN AI 所使用。

 

丁林葳任职的两家公司中,融数联智成立于 2019 年,专精于隐私计算,公司拥有自主研发的隐私保护芯片、多方安全计算软件系统、AI 联邦学习平台、可信计算 TEE 以及隐私计算一体机,为客户构建合法高效的数据协同链提供技术保障,助力数据在机构之间“可用不可见”的流通和融合应用,保障数据合作和数据流通的全链条安全,为数据要素发挥价值提供技术驱动。

 

至算科技是国内唯一最早推出单任务万卡级的大算力 AI 训练推理加速算力平台的公司,从底层系统上解决“国内做不了 50B 以上大模型”的痛点。信息显示,该项目创始人(丁林葳)曾在谷歌带队做出的 6 万卡 TPU、2.6 万 GPU 万卡级算力平台。本项目支持的算力规模可达单任务万卡,支持大模型训练时长从月级可降至小时级。

将谷歌技术机密上传至谷歌网盘,网友:事情绝不简单

 

起诉书提到,2022 年 5 月 21 日,Linwei Ding 开始将机密信息复制至个人 Google Cloud 账户,秘密上传保存在谷歌网络内部的商业机密。之后 Linwei Ding 持续定期上传,直到 2023 年 5 月 2 日,期间 Linwei Ding 共上传了 500 多个包含机密信息的独立文件。

 

美国司法部副部长 Lisa Monaco 表示,“在我们努力以负责任的方式发挥 AI 积极价值的同时,司法部也对其风险保持着高度警惕,包括可能对我们国家安全造成的全面威胁。从今天的指控来看,被告从谷歌公司处窃取到 500 多个包含 AI 商业机密的保密文件,同时也秘密在为希望取得 AI 技术竞赛领先优势的中国企业工作。司法部将不懈追查那些将颠覆性技术成果(特别是 AI)非法传出境外的人,并追究其责任。”

 

有网友质疑,“将谷歌技术机密上传至谷歌网盘”这一操作并不符合“窃密思维”,反而更像是正常的日常工作。有网友评论称,“不离职就只是工作,离职就是窃密”,也有网友将其归类于“阴谋论”:“内部技术人才辞工,不能把人才流去其他地方公司,然后找点所谓的证据,只有坐牢了就不会把前公司的技术泄露出去了”。

 

目前,关于该案只有美国司法部一面之词,当事人还未回应。值得一提的是,起诉书本身仅为涉案指控,被告在被法庭证明有罪之前,面临的一切指控均遵循疑罪从无原则。

 

参考链接:

https://www.justice.gov/opa/pr/chinese-national-residing-california-arrested-theft-artificial-intelligence-related-trade

2024-03-08 14:268214

评论

发布
暂无评论
发现更多内容

linux之systemctl命令

入门小站

Linux

java 虚拟机 GC 学习笔记二

风翱

JVM 9月日更

SRE实战(01)|初识SRE,探索SRE如何推进技术债务改造

方勇(gopher)

微服务 架构设计 SRE 服务治理 构架

WAF绕过总结+工具介绍

网络安全学海

网络安全 信息安全 渗透测试 WEB安全 漏洞挖掘

流程控制之for循环

秦时明月

Nebula Graph 源码解读系列 | Vol.02 详解 Validator

NebulaGraph

图数据库 源码学习 分布式图数据库

Nebula Graph 源码解读系列 | Vol.03 Planner 的实现

NebulaGraph

图数据库 源码学习 分布式图数据库

2022前端react面试题汇总

buchila11

React

基于线性预测的语音编码原理解析

拍乐云Pano

RTC 音频技术 python 数字信号

记一下日志引起的bug

卢卡多多

日志 9月日更

前端性能优化实战(一)

Augus

JavaScript 9月日更

【经验分享】RTC 技术系列之视频编解码

声网

音视频

数据仓库和数据湖比较

奔向架构师

数据湖 9月日更

「免费开源」基于Vue和Quasar的前端SPA项目crudapi零代码开发平台后台管理系统实战之元数据导出导入(十五)

crudapi

Vue API 元数据 crudapi quasar

模块四作业设计千万级学生管理系统的考试试卷存储方案

apple

Mp3文件结构全解析(二)

轻口味

android 音视频 9月日更

网络攻防学习笔记 Day146

穿过生命散发芬芳

9月日更 招投标

java虚拟机GC学习笔记一

风翱

GC 9月日更

【SpringCloud 技术专题】「Eureka 源码分析」从源码层面让你认识 Eureka 工作流程和运作机制(下)

码界西柚

微服务 SpringCloud Eureka 注册中心 9月日更

CPU虚拟化,磁盘虚拟化,内存虚拟化,io虚拟化

hanaper

iOS 优雅的处理网络数据,你真的会吗?不如看看这篇.

HelloWorld杰少

大前端 引航计划

24. AI只是人类的工具

Databri_AI

人工智能

网关乱码问题排查纪实

小江

k8s java; 字符集 ,docker JVM;

python之深浅拷贝

秦时明月

定时任务 Crontab 中的特殊字符

耳东@Erdong

crontab 9月日更

按键编码ASCII对照表

入门小站

工具

架构实战训练营|作业|模块4

Frode

「架构实战营」

Go 中更好的定时调度

baiyutang

golang 9月日更

一分钟了解MACH架构

俞凡

架构

Linux用户所属组变更

在即

9月日更

做一个有温度的程序员

牧小农

谷歌华人工程师被捕:号称“全球能搭建万卡级算力平台的十人之一”,在国内两公司担任CTO、CEO_AI&大模型_凌敏_InfoQ精选文章