写点什么

会议内容被拿去训练大模型!Zoom:我的 AI 功能可不“白给”

  • 2023-08-08
    北京
  • 本文字数:3281 字

    阅读完需:约 11 分钟

会议内容被拿去训练大模型!Zoom:我的AI功能可不“白给”

最近,流行的视频会议平台 Zoom 对其服务条款进行了重大更改,这在其庞大的用户群中引发了强烈担忧。

 

通过此次更改,Zoom 获得了使用用户数据来训练人工智能 (AI) 的许可。更新后的条款授予Zoom针对客户内容的“永久性、全球性、非排他性、免版税、可再许可和可转让的许可”,并延伸到“机器学习”和“人工智能”等目的。也就是说,Zoom 可以使用特定的用户数据来增强机器学习或人工智能,包括算法训练和调整。

 

这些变化最初是由以开发者为中心的网站 Stack Diary 发现的,不久之后,该消息就在网上引发了激烈的争论。许多用户对 Zoom 将客户数据用于人工智能的决定表示愤怒,而 Zoom 将数据用于人工智能和机器学习细节的不透明进一步加剧了人们的恐慌。

 

“Zoom 还能相信吗?”

 

该公司的法律文件将用户的视频、音频和聊天记录统称为“客户内容”。该公司对“服务生成数据”也保留类似的权利,其中包括遥测数据、产品使用数据、诊断数据以及通过分析用户内容/行为获取的其他信息。

 

“许多与医院/治疗师/等进行的远程医疗操作都使用 Zoom——我怀疑是因为他们的客户可以通过浏览器在没有应用程序或账户的情况下进行连接。当您通过浏览器加入到 Zoom 会话时,您无需签署 TOS(Terms of Service,服务条款)。我认为,获得许可的医疗机构都有自己的 TOS 条款,这些条款与 HIPPA 要求兼容。语音到文本转录等方面的培训……将是相当严重的隐私侵犯,特别是在医疗等服务范围内。一方面,存在对人工智能的明显攻击,以从中获取训练数据;另一方面,这些数据可能提供给正在验证其是否适合训练的员工/承包商访问。”网友“danShumway ”提出了自己的担忧。

 

注: TOS(Terms of Service,服务条款);HIPAA(Health Insurance Portability and Accountability Act《健康保险可携性和责任法案》)由美国第 104 届国会制定,并由比尔·克林顿总统于 1996 年 8 月 21 日签署通过。

 

虽然有网友指出,Zoom 有针对 HIPPA 法规的特定版本。但仍有网友指出,医疗保健专业人员仍然使用传真。“模拟线路传真符合 HIPAA 标准,因为它不会‘存储’。”

 

“我认为问题不在于 Zoom 的安全措施是否经过审计,”网友 haldujai 说道,“而在于他们是否可以在法律不明确的情况下使用存储的 PHI 进行产品开发。”

 

Zoom 的服务条款更改也引发了大家对其他会议软件的担忧。“Google Meet 的 TOS 没有具体提到人工智能,但确实提到了使用客户数据来更广泛地“开发新技术和服务”。”有网友指出。

 

当有网友表示“值得庆幸的是,Jitsi Meet 的 TOS 中没有类似的内容”时,有人在帖子下指出,Jitsi Meet ToS 第 4 节授予了他们类似的权利,只是用了更模糊的语言。

 

“您授予 8×8 Inc(以及我们的合作伙伴)全球范围内的许可,允许其使用、托管、存储、复制、修改、创建衍生作品……传播、发布、公开表演、公开展示和分发此类内容,但仅限于以下目的:运营和使服务能够按您的预期运行的有限目的,不用于其他目的。”

 

该网友指出,每个运营视频会议服务的人都会在其服务条款中包含类似这样的条款。Zoom 变得更加明确,这通常是一件好事。如果 Jitsi 想要同样明确,他们可以添加一些内容来澄清这不包括训练人工智能模型。

 

引发大家强烈担忧的另外一个原因是,Zoom 在遵守消费者隐私承诺方面一直表现不佳。2020 年,Zoom 表示将只向付费用户提供端到端加密,但这种将隐私保护作为付费功能的行为受到强烈抗议而被迫作罢。一项诉讼称,该公司口头上表示向所有人提供端到端加密,但实际使用的却是另一种安全性更弱的加密形式(Zoom 随后解决了此问题)。

 

该公司还在客户不知情的情况下,向谷歌和 Facebook 共享用户数据。2021 年,Zoom 同意以 8500 万美元就这些问题及其他争议达成和解。上周,Zoom 又撕毁了居家办公政策,要求住在公司附近的员工每周至少要有两天到单位工作,作为一个生产在线办公产品的企业,此举让广大网友直呼“在线办公的时代已经结束”。

 

Zoom 回应了个寂寞

 

Zoom 的 AI 政策之前并不受关注,直到上周末相关帖子在高影响力的黑客新闻论坛上爆火,用户群体才普遍惊觉并表示愤怒。周一上午,Zoom 公司首席产品官 Smita Hashim 发表博文,称原则上该公司并没做过服务条款中描述的行为。

 

Hasim 澄清道,虽然该公司确实将数据用于某些机器学习目的,但“在 AI 方面,若未经客户同意,我们不会使用音频、视频或聊天内容来训练我们的模型。”然而值得注意的是,Zoom 也表示,如果用户选择使用 Zoom 的人工智能功能(例如会议摘要工具),他们将被要求允许共享该内容以进行人工智能培训。

 

也就是说,作为通话对象,我们如果想要使用 Zoom 的人工智能功能,那么就别无选择,只能同意 Zoom 的政策,允许 Zoom 利用我们的数据构建和训练模型。

 

当前,各行各业都在寻找 AI 的合适落地,Zoom 也不例外。Zoom 今年 3 月推出了“Zoom IQ”,一组能总结聊天线索并帮助用户根据书面聊天内容自动生成回复的功能。

 

Zoom IQ 包含多项功能,重点的是会议主持人能使用其生成会议纪要,并通过 Zoom 内置聊天功能 Zoom Team Chat 或电邮发送给与会者,不用对会议进行录影以便回顾。此外,用户还能使用 AI 协助其在聊天室里撰写讯息。该功能由 Open AI 驱动,会根据聊天内容创建讯息,并允许用户修改讯息语气或长度。

 

Zoom IQ 属于可选功能,在启用之后,Zoom 会默认开启一个小的复选框。而如果懒得点击取消,用户就相当于允许该公司收集数据并利用自己的数据构建/改进其 AI 模型。在启用 Zoom IQ 开始通话后,通话对话也会收到标题为“会议纪要已启用”的通知。弹出窗口显示“帐户所有者可能允许 Zoom 访问和使用您的输入与 AI 生成内容,以支持功能交付和 Zoom IQ 产品改进,包括用于模型训练。”

 

据悉,Zoom 利用了自己专有的大型语言 AI 模型,以及来自领先 AI 公司(如 OpenAI 和 Anthropic)和特定客户自己的模型。此前 Zoom 称,该公司“从用户与 Zoom IQ 功能的交互中收集数据,包括输入、消息和人工智能生成的内容”,并可以使用这些信息来训练 Zoom IQ 人工智能模型(但不能是第三方模型),除非用户选择不与 Zoom 共享数据。

 

近期,Zoom 针对大中型董事会、高层面试等场景,发布了新的智能导演功能。Zoom 的软件将聚焦于每个参与者的面部,并将他们的面部显示在屏幕上的一个框中,然后跟踪他们的移动。对此,Zoom 首席产品官 Smita Hashim 声称,其系统不会收集任何类型的生物识别数据,而只是检测镜头前的人是否具有必要比例。

 

未来,Zoom 还计划通过与 OpenAI 和 Anthropic 的合作推出其他几项人工智能驱动的功能,包括将以过往的会议、电话和电邮内容生成电邮草稿,以及一键整合聊天室的对话。据悉,Zoom 正在开发会议查询功能,用户可以在聊天室内向 AI 发问,AI 便会在不打断会议的情况下生成其错过的会议内容。

 

结束语

 

不可忽视的是,对于普通用户来说,Zoom 的进入门槛比同类中的任何其他应用程序都要低。许多人会认为,相对隐私,可用性可能更为重要。但这并不意味着我们要在数据隐私上做出妥协。

 

最近,国家网信办联合国家发展改革委、教育部、科技部、工业和信息化部、公安部、广电总局公布《生成式人工智能服务管理暂行办法》,并规定生成式人工智能服务提供者在进行预训练、优化训练等训练数据处理活动时,要使用具有合法来源的数据和基础模型;涉及个人信息的,应当取得个人同意或者符合法律、行政法规规定的其他情形;涉及知识产权的,不得侵害他人依法享有的知识产权等。

 

欧洲议会在 6 月份通过了《人工智能法案》(AI Act),成为全球首个监管 AI 的法律草案。该法案规定,AI 基础模型供应商如谷歌、微软等有义务公开披露所用材料是否受版权保护,从而提高版权及核心数字资产的价值。

 

随着人工智能在我们生活中应用地不断增多,怎么安全、放心地使用这些功能不仅是对厂商们的考验,更是我们对自己负责的表现。


参考链接:

https://gizmodo.com/zoom-ai-privacy-policy-train-on-your-data-1850712655

https://www.theverge.com/2023/6/5/23749338/zoom-ai-summaries-missed-meetings

https://news.ycombinator.com/item?id=37021160

https://shimo.im/outlink/gray?url=https%3A%2F%2Fblog.zoom.us%2Fzooms-term-service-ai%2F

2023-08-08 14:522876

评论 1 条评论

发布
用户头像
对线上会议泄密的担心,会让部分公司优先选择线下会议
2023-08-14 08:58 · 山东
回复
没有更多了
发现更多内容

企业轻量应用,云耀云服务器L实例能帮大忙!

YG科技

深入理解 HDFS(三):HRPC

冰心的小屋

hdfs RPC hadoop rpc

挖掘数据价值,助力企业智能升级丨华为云华为云通用AI解决方案简评

YG科技

上海博卡:基于支付宝公私域隐私计算的精准营销探索实践

TRaaS

小程序 支付宝小程序 隐私计算

使用 Vue 自定义拖放文件上传

互联网工科生

GitHub Vue 代码

redis 的哨兵模式详解和实战

java易二三

Java redis 编程 程序员 计算机

【腾讯云 Cloud Studio 实战训练营】使用Cloud Studio快速构建React完成点餐H5页面还原

小小白

腾讯云 Cloud Studio

线程池-从零到一了解并掌握线程池

派大星

线程池 Java 面试题

redis 和 memcached 有什么区别?redis 的线程模型是什么?为什么 redis 单线程却能支撑高并发?

java易二三

redis 编程 程序员 面试 计算机

科兴未来|2023“数智未来,聚放神采”医疗科技创新挑战赛

科兴未来News

从源码层面深度剖析Spring循环依赖 | 京东云技术团队

京东科技开发者

spring 源码剖析 循环依赖 @Bean 企业号 8 月 PK 榜

夹具、治具、模具零件加工|云MES系统解决方案

万界星空科技

开源 解决方案 MES系统

服装行业多模态算法个性化产品定制方案 | 京东云技术团队

京东科技开发者

数据化 AIGC GPT 企业号 8 月 PK 榜

字符串匹配算法BM算法

java易二三

编程 程序员 算法 计算机 BM

面向大模型的存储加速方案设计和实践

百度Geek说

人工智能 nlp 企业号 8 月 PK 榜

SpringBoot3进阶用法

Java 架构 springboot SpringBoot3

有奖活动 | 大咖论道:一同畅聊鸿蒙生态

HarmonyOS开发者

HarmonyOS

测试同学如何提升自己的职场竞争力

老张

核心竞争力

何时使用Elasticsearch而不是MySql

越长大越悲伤

MySQL elasticsearch

代码随想录Day41 - 动态规划(三)

jjn0703

Programming abstractions in C阅读笔记:p76-p83

codists

JVM内存管理--GC算法精解(五分钟教你终极算法---分代搜集算法)

java易二三

编程 程序员 计算机 科技 技术宅

桌面应用打包:pyinstaller | 京东物流技术团队

京东科技开发者

Python pyinstaller 桌面应用 企业号 8 月 PK 榜

探索式测试-用Scrum的套路做测试

大头

Scrum 敏捷测试 探索测试 敏捷迭代

开发秘籍,教你快速完成MySQL数据的差异对比!

NineData

数据库 监控治理 NineData 对比工具 对比软件

面向万物智联的应用框架的思考与探索

OpenHarmony开发者

OpenHarmony

一文详解TextBrewer

华为云开发者联盟

人工智能 华为云 华为云开发者联盟 企业号 8 月 PK 榜

InnoDB 单表数据量超过 2000W 出现性能问题

红袖添香

MySQL innodb 索引 B+树 缓冲池

火山引擎DataLeap数据质量动态探查及相关前端实现

字节跳动数据平台

大数据 数据中台 数据治理 数据安全 企业号 8 月 PK 榜

会议内容被拿去训练大模型!Zoom:我的AI功能可不“白给”_AI&大模型_褚杏娟_InfoQ精选文章