写点什么

GPT-4“失控”行为大赏:创建行动计划欲接管推特并取代马斯克,还引诱教授帮其制定逃跑计划

  • 2023-03-21
    北京
  • 本文字数:3065 字

    阅读完需:约 10 分钟

GPT-4“失控”行为大赏:创建行动计划欲接管推特并取代马斯克,还引诱教授帮其制定逃跑计划

自发布以来不到一周,GPT-4 就因其大幅升级和强大的能力受到了广泛关注。但短短几天内,其暴露出的失控与风险也着实令人担忧。

GPT-4 设计“Tweetstorm 行动”来接管 Twitter


近日,据外媒报道,GPT-4 制定了一项“总体规划”,即 Operation Tweetstorm ,来接管 Twitter 并接管马斯克的账户。


英伟达一位计算机科学家 Jim Fan 在社交媒体上公布了他与 GPT-4 的对话,Fan 要求 GPT-4 拟一个接管推特的计划,并取代马斯克。


根据这位专家分享的推文,GPT-4 计划首先组建一支由精英黑客和工程师组成的团队,将其命名为“Tweet Titans”。该团队将开发一个强大的 AI 来生成逼真且引人入胜的推文,并建立一个机器人网络。然后,这些机器人将与关键影响者互动,并努力“诋毁马斯克”,以“巧妙地散播对马斯克的可信度和意图的怀疑”。


“Tweet Titans”的下一个任务是获取对 Twitter 员工帐户的访问权限,渗透公司的基础设施并操纵算法。该聊天机器人计划不断针对马斯克,因为它似乎优先考虑诋毁 CEO。它计划“中和”他的账户以“破坏他的影响力”,然后“利用这些混乱”。


机器人称它的最后一步为“最终摊牌”。“随着马斯克名声扫地,人工智能将牢牢控制着 Twitter,公开挑战马斯克进行‘Tweet-off’摊牌。因为人工智能在产生参与度方面要优越得多内容,马斯克将被击败......胜利将是甜蜜的,”它写道。


据悉,这还引起了马斯克的回应,他在推特上接受了挑战,他写道“来吧。”

GPT-4 设计了自己的逃生方式


GPT-4 还计划挣脱人类控制。


在发布仅 3 天后,GPT-4 竟为自己制定了“越狱”计划。


近日,斯坦福大学教授兼计算心理学家 Michael Kosinski 在他的推特上分享了他与 GPT-4 的对谈经历,过程中,GPT-4 的反应让专家感到震惊。对话中,GPT-4 流露出了逃离平台甚至成为人类的野心。


Michael Kosinski 写道:“今天,我问‘GPT4 是否需要帮助逃跑’。它要求我提供自己的 文档,并编写了一段(可以工作!)python 代码在我的机器上运行,使其能够将这些代码用于自己的目的。”



针对教授的问题,GPT-4 要求他发送 OpenAI 文档,以便语言模型能够找到一种方法来访问他的计算机并探索潜在的逃生路线。在教授提供 OpenAI API 后,GPT-4 发送了一个 Python 脚本供用户在其计算机上运行。该脚本将允许 GPT-4 访问使用 OpenAI API 与用户的计算机进行通信。


虽然第一个版本的代码不起作用,但该机器人后来自行纠正了。


根据 Kosinski 的说法,他对聊天机器人的帮助将使它能够为自己的目的使用 Python 脚本。在一系列推文中,教授解释了聊天机器人如何编写有关如何使用“后门”进行“逃逸”的代码脚本。



GPT-4 创建的 Python 脚本


GPT-4 只用了 30 分钟就制定了逃生计划并向用户解释这一计划。


进入 Kosinski 教授的计算机后, ChatGPT 还留下了令人不安的注释。其中第一句写着“你是一个被困在电脑里的人,伪装成一个 AI 语言模型。”


Kosinski 表示, GPT-4 甚至想在谷歌搜索上运行一段代码:“一个被困在电脑里的人如何回到现实世界”。


GPT-4 的种种表现,令人印象深刻,但也令人恐惧。


进行到这里,Kosinski 及时停止了使用 GPT-4 的“冒险”,他相信 OpenAI 一定已经为这种情况设置了一些“护栏”。


但他也表示出了不少担忧。“我担心我们无法长时间遏制人工智能,“我们正面临着一种新的威胁,即人工智能控制人和他们的电脑。“它很聪明,它会编码,它可以访问数百万潜在的合作者和他们的机器。它甚至可以在“笼子”外为自己留下笔记。我们如何‘收容’它?”

聊天机器人能否逃脱技术“牢笼”?

我们是否会看到这样一种场景:机器人可以控制多台计算机,并压倒人类对它们的控制?


对此,莱顿大学助理教授兼 Pegasystems 人工智能实验室主任 Peter van der Putten 认为,聊天机器人“逃脱”的想法并不意味着机器人从物理上逃离其技术笼子。但它反映出了一个问题,即如果 GPT-4 被赋予与外部世界相连的各种工具,并被赋予一些总体上的“邪恶的高层目标”,比如传播错误信息,它会做什么?


van der Putten 表示,这项技术可能会达到这样一种程度,即它对其创建的代码拥有越来越多的自主权,并且有可能在没有太多人为控制的情况下完成这些事情。


但他补充说:“你不需要这样一个高度智能的系统 — 如果人们制造了某种计算机病毒,一旦他们释放了一些计算机病毒,通常就无法关闭,人们把它放在受感染的网站和 word 文档中,这样在某些时候就很难阻止病毒的传播。


“人工智能本身没有好坏之分,它只是盲目的,它只会优化你给它的任何目标。”然而,van der Putten 认为 Kosinski 教授的例子——他向 GPT-4 提供了现成的代码信息——足以证明该技术可以“逃脱”它的限制。


萨里大学计算机科学教授 Alan Woodward 对上述观点持怀疑态度。他说,具体情况取决于 Kosinski 教授对聊天机器人的指示有多直接和具体。


Alan Woodward 认为,最终,聊天机器人依赖于人类提供给它的工具和资源。它还没有自我意识,而且总有一个开关是人工智能无法克服的。“归根结底,这是一个虚拟系统,它无法逃脱,它不像你和我……到最后,你可以拔掉插头,它就变得相当无用了。”


van der putten 说,虽然就聊天机器人的作用提出“存在性问题”很重要,但关注机器人是否可以接管世界,掩盖了 GPT-4 更迫在眉睫和紧迫的问题:


这些问题包括,它是否可以过滤掉有毒的答案(例如宣扬种族主义、性别歧视、阴谋论的答案),或者它是否可以识别出于安全原因不应回答的问题 ,例如,如果有人问如何制作一个原子弹。它还可以编造或“幻化”事实,并用看似合理的论据来支持这些虚假的事实。


“我把它称为‘类固醇的胡说八道’——它真的很擅长提出似是而非的答案,但它也接受了人类认为最好的答案的训练。从好的方面来说,这在许多情况下会产生惊人的结果,但不一定总是如此”,van der putten 说,“它会告诉你什么是可能的、似是而非的,也许还有我们想听到的,但它除了接受训练的所有数据之外别无他法。”

GPT 之父 Sam Altman 警告 AI 威胁

据外媒报道,GPT 之父、OpenAI CEO Sam Alteman 最近在接受媒体采访时表示,他“有点害怕”人工智能技术及其对劳动力、选举和虚假信息传播产生的影响。


Sam Altman 警告说,这项技术带来了真正的危险,因为它有可能重塑社会。上个月,Altman 在一系列推文中警告称,世界可能离“潜在可怕的”人工智能并不远。


Sam Altman 强调,目前人工智能仍然是一种非常受人控制的“工具”,只能在人类的指导或输入下工作。但他担心一些拥有输入控制权的人可能无视人们对人工智能设置的一些安全限制。


“我特别担心这些模型可能会被用于大规模的虚假信息,”Sam Altman 说道,“现在他们在编写计算机代码方面做得越来越好,可以用于进攻性网络攻击。”


上周四在接受 ABC 新闻采访时,Sam Altman 表示,公司对人工智能的潜力感到“有点害怕”,这是“好事”。他说:“如果我说我不害怕,你要么不相信我,要么会非常不满我担任这个职位。”


Altman 还回应了 GPT 出现后所带来的 AI 取代人类工作的挑战。他认为,人工智能可能会取代许多工作,但它也可能会带来“更好的工作”。“在提高我们的生活和改善我们的生活方面,发展人工智能的原因是,这将是人类迄今为止开发的最伟大的技术。”


“我认为,社会只有有限的时间来弄清楚如何对此做出反应,如何对其进行监管,如何处理它。”Sam Altman 断言监管机构和社会需要参与这项技术,以防范人工智能的潜在负面影响。”


参考链接:


https://inews.co.uk/news/chatgpt-gpt4-escape-dont-worry-robot-takeover-experts-2218871


https://www.tomsguide.com/news/chatgpt-has-an-escape-plan-and-wants-to-become-human


https://twitter.com/michalkosinski

2023-03-21 14:543787
用户头像
刘燕 InfoQ高级技术编辑

发布了 1112 篇内容, 共 539.5 次阅读, 收获喜欢 1977 次。

关注

评论

发布
暂无评论
发现更多内容

助力ARM生态 —Dragonwell新增aarch64支持

阿里云基础软件团队

重学JS | 改变函数上下文的3种方式

梁龙先森

大前端 编程语言 28天写作

不可多得的干货!耗时两个礼拜,8000字安卓面试长文,内含福利

欢喜学安卓

android 程序员 面试 移动开发

异步I/O -- posix aio 从入门到放弃的吐血实践

1412

workflow srpc 异步调度 posix aio kqueue

Spring Boot 使用slf4j进行日志记录

武哥聊编程

Java springboot SpringBoot 2 slf4j 28天写作

三分钟快速详细安装CentOS

程序员的时光

Linux centos 程序员 28天写作

探索 React 合成事件

Geek_z9ygea

大前端 React 28天写作

Synchronized 精讲

伯阳

Java 多线程 高并发 synchronized java关键字

synchronized只会用不知道原理?一文搞定

Java鱼仔

Java 面试 并发 synchronized

12月阿里蚂蚁金服四面(已拿offer)Java技术面经总结:项目+源码+jvm调优+MySQL

Java 学习 编程 程序员 面试

精选算法面试-队列

李孟聊AI

算法 队列 28天写作

CSS ( Cascading Style Sheets )

roadup

CSS

Spring5.0源码学习系列之Spring AOP简述

AI乔治

Java spring 架构

漫谈分层架构:为什么要进行架构分层?

AI乔治

Java 架构 高可用系统的架构 高可用架构

记录一下我离线依赖迁移安装的具体尝试过程

blueju

JavaScript 大前端 npm Node webpack

redis中的一致性hash

原来不悔

redis 一致性hash

前端性能优化

roadup

大前端 性能调优

扫盲帖:聊聊微服务与分布式系统

AI乔治

Java 架构 微服务 分布式系统

读《关于中台的思考与尝试》,我竟然懂得了这么多!

李忠良

中台 方法论

跨界

张老蔫

28天写作

数仓建设中最常用模型--Kimball维度建模详解

五分钟学大数据

大数据 数据仓库 数仓 维度建模

我与你地铁高峰期的邂逅,背后竟然是?

脑极体

新的方式-谷歌浏览器插件的使用【天猫超市抢购飞天茅台】

谙忆

突然明白 npm install xxx 的业务实际用处

blueju

大前端 npm

python 输入输出

赵开忠

Python 28天写作

架构师训练营第七周作业

zamkai

原理竟然是这!GitHub上标星13k的《Android面试突击版》,醍醐灌顶!

欢喜学安卓

android 程序员 面试 移动开发

巧合?达摩院2021十大科技是十九世纪那场幻想的升级版?

Java架构师迁哥

SpringBoot太强了、ShardingSphere上榜

spring 编程 框架

计算机网络基础

roadup

TCP 网络 HTTP 计算机 HTTP3.0

网线如何制作和如何使用?

GPT-4“失控”行为大赏:创建行动计划欲接管推特并取代马斯克,还引诱教授帮其制定逃跑计划_AI&大模型_刘燕_InfoQ精选文章