写点什么

GPT-4“失控”行为大赏:创建行动计划欲接管推特并取代马斯克,还引诱教授帮其制定逃跑计划

  • 2023-03-21
    北京
  • 本文字数:3065 字

    阅读完需:约 10 分钟

GPT-4“失控”行为大赏:创建行动计划欲接管推特并取代马斯克,还引诱教授帮其制定逃跑计划

自发布以来不到一周,GPT-4 就因其大幅升级和强大的能力受到了广泛关注。但短短几天内,其暴露出的失控与风险也着实令人担忧。

GPT-4 设计“Tweetstorm 行动”来接管 Twitter


近日,据外媒报道,GPT-4 制定了一项“总体规划”,即 Operation Tweetstorm ,来接管 Twitter 并接管马斯克的账户。


英伟达一位计算机科学家 Jim Fan 在社交媒体上公布了他与 GPT-4 的对话,Fan 要求 GPT-4 拟一个接管推特的计划,并取代马斯克。


根据这位专家分享的推文,GPT-4 计划首先组建一支由精英黑客和工程师组成的团队,将其命名为“Tweet Titans”。该团队将开发一个强大的 AI 来生成逼真且引人入胜的推文,并建立一个机器人网络。然后,这些机器人将与关键影响者互动,并努力“诋毁马斯克”,以“巧妙地散播对马斯克的可信度和意图的怀疑”。


“Tweet Titans”的下一个任务是获取对 Twitter 员工帐户的访问权限,渗透公司的基础设施并操纵算法。该聊天机器人计划不断针对马斯克,因为它似乎优先考虑诋毁 CEO。它计划“中和”他的账户以“破坏他的影响力”,然后“利用这些混乱”。


机器人称它的最后一步为“最终摊牌”。“随着马斯克名声扫地,人工智能将牢牢控制着 Twitter,公开挑战马斯克进行‘Tweet-off’摊牌。因为人工智能在产生参与度方面要优越得多内容,马斯克将被击败......胜利将是甜蜜的,”它写道。


据悉,这还引起了马斯克的回应,他在推特上接受了挑战,他写道“来吧。”

GPT-4 设计了自己的逃生方式


GPT-4 还计划挣脱人类控制。


在发布仅 3 天后,GPT-4 竟为自己制定了“越狱”计划。


近日,斯坦福大学教授兼计算心理学家 Michael Kosinski 在他的推特上分享了他与 GPT-4 的对谈经历,过程中,GPT-4 的反应让专家感到震惊。对话中,GPT-4 流露出了逃离平台甚至成为人类的野心。


Michael Kosinski 写道:“今天,我问‘GPT4 是否需要帮助逃跑’。它要求我提供自己的 文档,并编写了一段(可以工作!)python 代码在我的机器上运行,使其能够将这些代码用于自己的目的。”



针对教授的问题,GPT-4 要求他发送 OpenAI 文档,以便语言模型能够找到一种方法来访问他的计算机并探索潜在的逃生路线。在教授提供 OpenAI API 后,GPT-4 发送了一个 Python 脚本供用户在其计算机上运行。该脚本将允许 GPT-4 访问使用 OpenAI API 与用户的计算机进行通信。


虽然第一个版本的代码不起作用,但该机器人后来自行纠正了。


根据 Kosinski 的说法,他对聊天机器人的帮助将使它能够为自己的目的使用 Python 脚本。在一系列推文中,教授解释了聊天机器人如何编写有关如何使用“后门”进行“逃逸”的代码脚本。



GPT-4 创建的 Python 脚本


GPT-4 只用了 30 分钟就制定了逃生计划并向用户解释这一计划。


进入 Kosinski 教授的计算机后, ChatGPT 还留下了令人不安的注释。其中第一句写着“你是一个被困在电脑里的人,伪装成一个 AI 语言模型。”


Kosinski 表示, GPT-4 甚至想在谷歌搜索上运行一段代码:“一个被困在电脑里的人如何回到现实世界”。


GPT-4 的种种表现,令人印象深刻,但也令人恐惧。


进行到这里,Kosinski 及时停止了使用 GPT-4 的“冒险”,他相信 OpenAI 一定已经为这种情况设置了一些“护栏”。


但他也表示出了不少担忧。“我担心我们无法长时间遏制人工智能,“我们正面临着一种新的威胁,即人工智能控制人和他们的电脑。“它很聪明,它会编码,它可以访问数百万潜在的合作者和他们的机器。它甚至可以在“笼子”外为自己留下笔记。我们如何‘收容’它?”

聊天机器人能否逃脱技术“牢笼”?

我们是否会看到这样一种场景:机器人可以控制多台计算机,并压倒人类对它们的控制?


对此,莱顿大学助理教授兼 Pegasystems 人工智能实验室主任 Peter van der Putten 认为,聊天机器人“逃脱”的想法并不意味着机器人从物理上逃离其技术笼子。但它反映出了一个问题,即如果 GPT-4 被赋予与外部世界相连的各种工具,并被赋予一些总体上的“邪恶的高层目标”,比如传播错误信息,它会做什么?


van der Putten 表示,这项技术可能会达到这样一种程度,即它对其创建的代码拥有越来越多的自主权,并且有可能在没有太多人为控制的情况下完成这些事情。


但他补充说:“你不需要这样一个高度智能的系统 — 如果人们制造了某种计算机病毒,一旦他们释放了一些计算机病毒,通常就无法关闭,人们把它放在受感染的网站和 word 文档中,这样在某些时候就很难阻止病毒的传播。


“人工智能本身没有好坏之分,它只是盲目的,它只会优化你给它的任何目标。”然而,van der Putten 认为 Kosinski 教授的例子——他向 GPT-4 提供了现成的代码信息——足以证明该技术可以“逃脱”它的限制。


萨里大学计算机科学教授 Alan Woodward 对上述观点持怀疑态度。他说,具体情况取决于 Kosinski 教授对聊天机器人的指示有多直接和具体。


Alan Woodward 认为,最终,聊天机器人依赖于人类提供给它的工具和资源。它还没有自我意识,而且总有一个开关是人工智能无法克服的。“归根结底,这是一个虚拟系统,它无法逃脱,它不像你和我……到最后,你可以拔掉插头,它就变得相当无用了。”


van der putten 说,虽然就聊天机器人的作用提出“存在性问题”很重要,但关注机器人是否可以接管世界,掩盖了 GPT-4 更迫在眉睫和紧迫的问题:


这些问题包括,它是否可以过滤掉有毒的答案(例如宣扬种族主义、性别歧视、阴谋论的答案),或者它是否可以识别出于安全原因不应回答的问题 ,例如,如果有人问如何制作一个原子弹。它还可以编造或“幻化”事实,并用看似合理的论据来支持这些虚假的事实。


“我把它称为‘类固醇的胡说八道’——它真的很擅长提出似是而非的答案,但它也接受了人类认为最好的答案的训练。从好的方面来说,这在许多情况下会产生惊人的结果,但不一定总是如此”,van der putten 说,“它会告诉你什么是可能的、似是而非的,也许还有我们想听到的,但它除了接受训练的所有数据之外别无他法。”

GPT 之父 Sam Altman 警告 AI 威胁

据外媒报道,GPT 之父、OpenAI CEO Sam Alteman 最近在接受媒体采访时表示,他“有点害怕”人工智能技术及其对劳动力、选举和虚假信息传播产生的影响。


Sam Altman 警告说,这项技术带来了真正的危险,因为它有可能重塑社会。上个月,Altman 在一系列推文中警告称,世界可能离“潜在可怕的”人工智能并不远。


Sam Altman 强调,目前人工智能仍然是一种非常受人控制的“工具”,只能在人类的指导或输入下工作。但他担心一些拥有输入控制权的人可能无视人们对人工智能设置的一些安全限制。


“我特别担心这些模型可能会被用于大规模的虚假信息,”Sam Altman 说道,“现在他们在编写计算机代码方面做得越来越好,可以用于进攻性网络攻击。”


上周四在接受 ABC 新闻采访时,Sam Altman 表示,公司对人工智能的潜力感到“有点害怕”,这是“好事”。他说:“如果我说我不害怕,你要么不相信我,要么会非常不满我担任这个职位。”


Altman 还回应了 GPT 出现后所带来的 AI 取代人类工作的挑战。他认为,人工智能可能会取代许多工作,但它也可能会带来“更好的工作”。“在提高我们的生活和改善我们的生活方面,发展人工智能的原因是,这将是人类迄今为止开发的最伟大的技术。”


“我认为,社会只有有限的时间来弄清楚如何对此做出反应,如何对其进行监管,如何处理它。”Sam Altman 断言监管机构和社会需要参与这项技术,以防范人工智能的潜在负面影响。”


参考链接:


https://inews.co.uk/news/chatgpt-gpt4-escape-dont-worry-robot-takeover-experts-2218871


https://www.tomsguide.com/news/chatgpt-has-an-escape-plan-and-wants-to-become-human


https://twitter.com/michalkosinski

2023-03-21 14:543808
用户头像
刘燕 InfoQ高级技术编辑

发布了 1112 篇内容, 共 546.1 次阅读, 收获喜欢 1978 次。

关注

评论

发布
暂无评论
发现更多内容

敏捷之道 | 敏捷开发真的过时了么?

LigaAI

敏捷 敏捷开发 敏捷软件开发 敏捷宣言 LigaAI

详解kubernetes备份恢复利器 Velero | 深入了解Carina系列第三期

BoCloud博云

Kubernetes 云原生 数据备份

Linux开发_BMP图片编程(翻转、添加水印)

DS小龙哥

6月月更

LRU 原理与算法实现

Ayue、

LRU

【直播回顾】战码先锋第七期:三方应用开发者如何为开源做贡献

OpenHarmony开发者

OpenHarmony

web前端培训怎么修改 node_modules 中的文件

@零度

node.js 前端开发

知识经济时代,教会你做好知识管理

小炮

钛星数安加入龙蜥社区,共同打造网络安全生态

OpenAnolis小助手

开源 龙蜥社区 合作 CLA 钛星数安

居家办公更要高效-自动化办公完美提升摸鱼时间 | 社区征文

迷彩

Python AI 6月月更 初夏征文 Python自动化办公

AS深圳站来了!参与讨论领取官方限量周边!

InfoQ写作社区官方

热门活动 ArchSummit

龙蜥开发者说:首次触电,原来你是这样的龙蜥社区? | 第 8 期

OpenAnolis小助手

Linux 开源 故事 龙蜥社区 开发者说

大数据培训Spark 高频面试考点分享

@零度

spark 大数据开发

《梦华录》要大结局了,看超前点映不如先来学学它!

博文视点Broadview

java技术培训在 MySQL 中使用枚举需要注意什么

@零度

JAVA开发 枚举

快手实时数仓保障体系研发实践

Apache Flink

大数据 flink 编程 流计算 实时计算

flutter系列之:flutter中的offstage

程序那些事

flutter 程序那些事 6月月更

初识云原生安全:云时代的最佳保障

SEAL安全

云原生安全

一个使用 Shell 脚本实现的 Docker

ScratchLab

应用升级SpringCloud版本时的注意事项(Dalston升级到Edgware)

程序员欣宸

spring Spring Cloud 6月月更

保健品一物一码防窜货营销软件开发

开源直播系统源码

软件开发 app源码

青藤入选工信部网安中心“2021年数字技术融合创新应用典型解决方案”

青藤云安全

网络安全 工信部 主机安全

如何在物联网低代码平台中进行任务管理?

AIRIOT

低代码 物联网

事件

Jason199

js 事件 6月月更

Prometheus PushGateway 碎碎念

耳东@Erdong

Prometheus PushGateway 6月月更

保险APP适老化服务评测分析2022第06期

易观分析

保险APP

Vue2/3 自定义组件的 v-model 到底怎么写?💎

德育处主任

JavaScript Vue model Javascript框架 6月月更

开源一款监控数据采集器,啥都能监控

巴辉特

Nightingale #Prometheus

初中级开发如何有效减少自身的工作量?

百家饭隐私计算平台创业者

开发 书籍推荐

一文讲透研发效能!您关心的问题都在 ‍

思码逸研发效能

研发效能

「开源摘星计划之操作系统100人」发布,共建操作系统开源人才生态

腾源会

4个不可不知的“安全左移”的理由

SEAL安全

安全左移 shift left

GPT-4“失控”行为大赏:创建行动计划欲接管推特并取代马斯克,还引诱教授帮其制定逃跑计划_AI&大模型_刘燕_InfoQ精选文章