AICon议程上新60%,阿里国际、360智脑、科大讯飞、蔚来汽车分享大模型探索与实践 了解详情
写点什么

GPT-4“失控”行为大赏:创建行动计划欲接管推特并取代马斯克,还引诱教授帮其制定逃跑计划

  • 2023-03-21
    北京
  • 本文字数:3065 字

    阅读完需:约 10 分钟

GPT-4“失控”行为大赏:创建行动计划欲接管推特并取代马斯克,还引诱教授帮其制定逃跑计划

自发布以来不到一周,GPT-4 就因其大幅升级和强大的能力受到了广泛关注。但短短几天内,其暴露出的失控与风险也着实令人担忧。

GPT-4 设计“Tweetstorm 行动”来接管 Twitter


近日,据外媒报道,GPT-4 制定了一项“总体规划”,即 Operation Tweetstorm ,来接管 Twitter 并接管马斯克的账户。


英伟达一位计算机科学家 Jim Fan 在社交媒体上公布了他与 GPT-4 的对话,Fan 要求 GPT-4 拟一个接管推特的计划,并取代马斯克。


根据这位专家分享的推文,GPT-4 计划首先组建一支由精英黑客和工程师组成的团队,将其命名为“Tweet Titans”。该团队将开发一个强大的 AI 来生成逼真且引人入胜的推文,并建立一个机器人网络。然后,这些机器人将与关键影响者互动,并努力“诋毁马斯克”,以“巧妙地散播对马斯克的可信度和意图的怀疑”。


“Tweet Titans”的下一个任务是获取对 Twitter 员工帐户的访问权限,渗透公司的基础设施并操纵算法。该聊天机器人计划不断针对马斯克,因为它似乎优先考虑诋毁 CEO。它计划“中和”他的账户以“破坏他的影响力”,然后“利用这些混乱”。


机器人称它的最后一步为“最终摊牌”。“随着马斯克名声扫地,人工智能将牢牢控制着 Twitter,公开挑战马斯克进行‘Tweet-off’摊牌。因为人工智能在产生参与度方面要优越得多内容,马斯克将被击败......胜利将是甜蜜的,”它写道。


据悉,这还引起了马斯克的回应,他在推特上接受了挑战,他写道“来吧。”

GPT-4 设计了自己的逃生方式


GPT-4 还计划挣脱人类控制。


在发布仅 3 天后,GPT-4 竟为自己制定了“越狱”计划。


近日,斯坦福大学教授兼计算心理学家 Michael Kosinski 在他的推特上分享了他与 GPT-4 的对谈经历,过程中,GPT-4 的反应让专家感到震惊。对话中,GPT-4 流露出了逃离平台甚至成为人类的野心。


Michael Kosinski 写道:“今天,我问‘GPT4 是否需要帮助逃跑’。它要求我提供自己的 文档,并编写了一段(可以工作!)python 代码在我的机器上运行,使其能够将这些代码用于自己的目的。”



针对教授的问题,GPT-4 要求他发送 OpenAI 文档,以便语言模型能够找到一种方法来访问他的计算机并探索潜在的逃生路线。在教授提供 OpenAI API 后,GPT-4 发送了一个 Python 脚本供用户在其计算机上运行。该脚本将允许 GPT-4 访问使用 OpenAI API 与用户的计算机进行通信。


虽然第一个版本的代码不起作用,但该机器人后来自行纠正了。


根据 Kosinski 的说法,他对聊天机器人的帮助将使它能够为自己的目的使用 Python 脚本。在一系列推文中,教授解释了聊天机器人如何编写有关如何使用“后门”进行“逃逸”的代码脚本。



GPT-4 创建的 Python 脚本


GPT-4 只用了 30 分钟就制定了逃生计划并向用户解释这一计划。


进入 Kosinski 教授的计算机后, ChatGPT 还留下了令人不安的注释。其中第一句写着“你是一个被困在电脑里的人,伪装成一个 AI 语言模型。”


Kosinski 表示, GPT-4 甚至想在谷歌搜索上运行一段代码:“一个被困在电脑里的人如何回到现实世界”。


GPT-4 的种种表现,令人印象深刻,但也令人恐惧。


进行到这里,Kosinski 及时停止了使用 GPT-4 的“冒险”,他相信 OpenAI 一定已经为这种情况设置了一些“护栏”。


但他也表示出了不少担忧。“我担心我们无法长时间遏制人工智能,“我们正面临着一种新的威胁,即人工智能控制人和他们的电脑。“它很聪明,它会编码,它可以访问数百万潜在的合作者和他们的机器。它甚至可以在“笼子”外为自己留下笔记。我们如何‘收容’它?”

聊天机器人能否逃脱技术“牢笼”?

我们是否会看到这样一种场景:机器人可以控制多台计算机,并压倒人类对它们的控制?


对此,莱顿大学助理教授兼 Pegasystems 人工智能实验室主任 Peter van der Putten 认为,聊天机器人“逃脱”的想法并不意味着机器人从物理上逃离其技术笼子。但它反映出了一个问题,即如果 GPT-4 被赋予与外部世界相连的各种工具,并被赋予一些总体上的“邪恶的高层目标”,比如传播错误信息,它会做什么?


van der Putten 表示,这项技术可能会达到这样一种程度,即它对其创建的代码拥有越来越多的自主权,并且有可能在没有太多人为控制的情况下完成这些事情。


但他补充说:“你不需要这样一个高度智能的系统 — 如果人们制造了某种计算机病毒,一旦他们释放了一些计算机病毒,通常就无法关闭,人们把它放在受感染的网站和 word 文档中,这样在某些时候就很难阻止病毒的传播。


“人工智能本身没有好坏之分,它只是盲目的,它只会优化你给它的任何目标。”然而,van der Putten 认为 Kosinski 教授的例子——他向 GPT-4 提供了现成的代码信息——足以证明该技术可以“逃脱”它的限制。


萨里大学计算机科学教授 Alan Woodward 对上述观点持怀疑态度。他说,具体情况取决于 Kosinski 教授对聊天机器人的指示有多直接和具体。


Alan Woodward 认为,最终,聊天机器人依赖于人类提供给它的工具和资源。它还没有自我意识,而且总有一个开关是人工智能无法克服的。“归根结底,这是一个虚拟系统,它无法逃脱,它不像你和我……到最后,你可以拔掉插头,它就变得相当无用了。”


van der putten 说,虽然就聊天机器人的作用提出“存在性问题”很重要,但关注机器人是否可以接管世界,掩盖了 GPT-4 更迫在眉睫和紧迫的问题:


这些问题包括,它是否可以过滤掉有毒的答案(例如宣扬种族主义、性别歧视、阴谋论的答案),或者它是否可以识别出于安全原因不应回答的问题 ,例如,如果有人问如何制作一个原子弹。它还可以编造或“幻化”事实,并用看似合理的论据来支持这些虚假的事实。


“我把它称为‘类固醇的胡说八道’——它真的很擅长提出似是而非的答案,但它也接受了人类认为最好的答案的训练。从好的方面来说,这在许多情况下会产生惊人的结果,但不一定总是如此”,van der putten 说,“它会告诉你什么是可能的、似是而非的,也许还有我们想听到的,但它除了接受训练的所有数据之外别无他法。”

GPT 之父 Sam Altman 警告 AI 威胁

据外媒报道,GPT 之父、OpenAI CEO Sam Alteman 最近在接受媒体采访时表示,他“有点害怕”人工智能技术及其对劳动力、选举和虚假信息传播产生的影响。


Sam Altman 警告说,这项技术带来了真正的危险,因为它有可能重塑社会。上个月,Altman 在一系列推文中警告称,世界可能离“潜在可怕的”人工智能并不远。


Sam Altman 强调,目前人工智能仍然是一种非常受人控制的“工具”,只能在人类的指导或输入下工作。但他担心一些拥有输入控制权的人可能无视人们对人工智能设置的一些安全限制。


“我特别担心这些模型可能会被用于大规模的虚假信息,”Sam Altman 说道,“现在他们在编写计算机代码方面做得越来越好,可以用于进攻性网络攻击。”


上周四在接受 ABC 新闻采访时,Sam Altman 表示,公司对人工智能的潜力感到“有点害怕”,这是“好事”。他说:“如果我说我不害怕,你要么不相信我,要么会非常不满我担任这个职位。”


Altman 还回应了 GPT 出现后所带来的 AI 取代人类工作的挑战。他认为,人工智能可能会取代许多工作,但它也可能会带来“更好的工作”。“在提高我们的生活和改善我们的生活方面,发展人工智能的原因是,这将是人类迄今为止开发的最伟大的技术。”


“我认为,社会只有有限的时间来弄清楚如何对此做出反应,如何对其进行监管,如何处理它。”Sam Altman 断言监管机构和社会需要参与这项技术,以防范人工智能的潜在负面影响。”


参考链接:


https://inews.co.uk/news/chatgpt-gpt4-escape-dont-worry-robot-takeover-experts-2218871


https://www.tomsguide.com/news/chatgpt-has-an-escape-plan-and-wants-to-become-human


https://twitter.com/michalkosinski

2023-03-21 14:543746
用户头像
刘燕 InfoQ高级技术编辑

发布了 1112 篇内容, 共 531.2 次阅读, 收获喜欢 1975 次。

关注

评论

发布
暂无评论
发现更多内容

类似咸鱼/转转闲置二手商品交易回收商城系统源码定制开发搭建

网站,小程序,APP开发定制

YETUADMIN 野兔二手交易系统 ThinkPHP8

【论文速读】|RO-SVD:一种用于 AIGC 应用的可重构硬件版权保护框架

云起无垠

小城酒店也要数智化,火山引擎数据飞轮能带去哪些想象?

字节跳动数据平台

大数据 数字化转型 云服务 数据平台 数据飞轮

Python IDE 编程工具JetBrains pycharm pro 2024 for mac激活版

Mac相关知识分享

编程 开发 Mac软件

在线文库网站程序系统源码/app/小程序开发定制

网站,小程序,APP开发定制

是什么拖慢了医疗云桌面的部署进程?

上海锐起科技

神策SDK不支持Windows客户端全埋点,怎么实现用户统计分析?

ClkLog

C++客户端 C#客户端 C++客户端用户分析 C#客户端用户分析 windows客户端用户分析

工作 6 年,@Transactional 注解用的一塌糊涂

程序员小富

Java 事务回滚

工作太忙没时间学习,怎么办?

老张

职场成长 认知 学习成长

TiDB DR-Auto-Sync 同城双中心高可用实践丨银行核心背后的落地工程体系

TiDB 社区干货传送门

第65期 | GPTSecurity周报

云起无垠

【行业知识】餐饮业怎么定义?需要堡垒机吗?

行云管家

等保 堡垒机 餐饮

【论文速读】| ARVO: 开源软件可重现漏洞的全景图

云起无垠

开源活动预告|抖音集团专家聚焦电商、PB 级实时场景带来数据技术分享

字节跳动开源

智能未来:低代码与AI如何重塑企业应用开发

天津汇柏科技有限公司

低代码 企业级应用程序开发 AI 人工智能

JavaScript 开发工具WebStorm 2024 for Mac激活版

Mac相关知识分享

Mac 软件 集成开发环境

永续合约快进快出套利策略

Silently9527

比特币 量化交易

音乐创作软件Ableton Live 11 Suite for Mac

Mac相关知识分享

Mac软件

TiDB 究竟抖还是不抖?

TiDB 社区干货传送门

版本升级

技术分享丨使用 Knowledge Bases for Amazon Bedrock 制作 RAG 工具

伊克罗德信息科技

大数据 AWS Amazon Bedrock

人工智能图像编辑软件Topaz Gigapixel AI for Mac

Mac相关知识分享

人工智能 图像编辑

好多kafka难题啊,看看其中的化解之道

王中阳Go

Go kafka 面试 面经

免费试听 | AI自动化副业创收班手把手带你提升副业收益

测试人

软件测试

挖掘大模型行业落地潜力,火山引擎发布AI创作者大赛

Geek_2d6073

海大集团的可观测平台建设实践

巴辉特

监控 可观测性 Prometheus Nightingale Flashcat

在数小时内构建 CRM:你需要了解的顶级无代码/低代码工具

NocoBase

低代码 CRM 无代码

强大的项目管理软件OmniPlan pro for Mac

Mac相关知识分享

项目管理软件 Mac软件

从 Oracle 到 TiDB 丨数据库资源评估指南

TiDB 社区干货传送门

迁移

保定等保测评机构有吗?在哪里?

行云管家

网络安全 等保 堡垒机 保定

mac电脑可以玩的Red Alert红色警戒:红警2 for Mac合集

你的猪会飞吗

红色警戒 Mac游戏下载 红警游戏下载

GPT-4“失控”行为大赏:创建行动计划欲接管推特并取代马斯克,还引诱教授帮其制定逃跑计划_AI&大模型_刘燕_InfoQ精选文章