写点什么

ChatGPT 联网终极进化!插件系统正式开放、无需编码就能上手,网友:这是我见过最疯狂的系统

  • 2023-03-24
    北京
  • 本文字数:4219 字

    阅读完需:约 14 分钟

ChatGPT联网终极进化!插件系统正式开放、无需编码就能上手,网友:这是我见过最疯狂的系统

当地时间 3 月 23 日,OpenAI 宣布正式上线了以安全为核心的 ChatGPT 插件系统。OpenAI 插件将 ChatGPT 连接到第三方应用程序,之后 ChatGPT 便能够与开发人员定义的 API 进行交互,从而增强 ChatGPT 的功能并允许其执行范围广泛的操作,主要包括:


  • 检索实时信息,例如体育比赛成绩、股票价格、最新消息等。

  • 检索知识库信息,例如公司文件、个人笔记等。

  • 代表用户执行操作,例如订机票、订餐等。


目前,插件系统还处于 alpha 测试期,首批参与插件创建的厂商包括 Expedia、FiscalNote、Instacart、KAYAK、Klarna、Milo、OpenTable、Shopify、Slack、Speak、Wolfram 和 Zapier。


其他使用插件的开发者可以申请进入候补名单(https://openai.com/waitlist/plugins)。OpenAI 表示,在了解更多情况后将逐步开放访问范围。



注:Expedia:让您的旅行梦想成真——抵达、驻足、尽享一切美景和体验。

FiscalNote:在法律、政治和监管数据与信息需求提供并选择市场领先的实时数据集。

Instacart:从您最喜爱的本地杂货店订购日用百货。

KAYAK:搜索航班、住宿和租车信息,获取预算空间之内的一切出行建议。

Klarna Shopping:从数以千计的网上商店中搜索和比较商品价格。

Milo Family AI:每天 20 分钟,让父母获得化狂躁为魔法的超能力。用法简单:Hey Milo,今天有什么魔法?

OpenTable:提供餐厅推荐,并附带预订链接。

Shop:覆盖全球各知名品牌的数百万种产品。

Speak:使用 AI 导师 Speak,学习如何用外语表达自己。

Wolfram:通过 Wolfram|Alpha 和 Wolfram Language 访问计算、数学、精选 知识和实时数据。

Zapier:与 5000 多款应用程序交互,包括 Google Sheets, Trello, Gmail, HubSpot, Salesforce 等。


另外,OpenAI 还自己托管了两款插件,其一为网络浏览器,其二是代码解释器。OpenAI 开源了一款知识库检索插件的代码,任何开发者都可以借此托管用于增强 ChatGPT 的信息。


OpenAI 表示,现在的语言模型虽然在各类任务中都能有所表现,但结果还不尽人意。而模型提升自我的唯一途径就是其训练数据。但一个问题是,数据内容可能已经过时,而且模型往往“以偏概全”、“生搬硬套”。此外,语言模型唯一能够开箱即用的输出模式就是文本,虽然文本中包含实用说明,但要将其化为操作还需要经历额外的过程。


OpenAI 将插件比喻成语言模型的“眼睛和耳朵”,能帮助模型访问因为较新、较私人或较具体而不宜包含在训练数据内的信息。为了响应用户的明确要求,插件还能帮助语言模型切实执行安全、受控的操作,从而提高整个系统的实用性


00:00 / 00:00
    1.0x
    • 3.0x
    • 2.5x
    • 2.0x
    • 1.5x
    • 1.25x
    • 1.0x
    • 0.75x
    • 0.5x
    网页全屏
    全屏
    00:00


    ChatGPT 插件使用示例

    插件的表现如何?


    我们先看下 OpenAI 自己托管的两个插件表现如何。

    浏览插件


    一套知道该何时及如何浏览互联网的实验性模型。


    以往,ChatGPT 会礼貌地指出,其训练数据中不具备充足的信息,因此无法回答某些特定问题。但现在可以给出答案和相关链接了。


    在 OpenAI 展示的示例中,ChatGPT 会检索关于最新一届奥斯卡颁奖典礼的信息,再用其最擅长的“写诗”能力加以改编。



    以下是 ChatGPT 的回答,它给出了一系列的搜索结果,用户直接点击就可查看相关的信息来源。



    除了为最终用户提供显著的实用性助益之外,OpenAI 认为,这种对语言和聊天模型全面可解释性的研究,也将在可扩展性和对齐能力方面带来令人兴奋的前景。

    代码解释器


    一套可使用 Python 处理上传和下载的实验性 ChatGPT 模型。


    OpenAI 为模型开发了一个可在沙盒、防火墙执行环境中工作的 Python 解释器,外加一些临时磁盘空间。解释器插件运行的代码会在一个持久会话中进行评估,且该会话在聊天期间始终有效(具有上限超时),后续调用可以相互构建。此外,还支持将文件上传至当前对话工作区,并下载工作结果。


    比如,当问到:一块砖的重量是这块砖自身 30% 的重量与 5 个 GPU 的重量之和,已知每吨重量包含了 100 块砖和 200 个 GPU,那么一块砖的重量是多少?



    ChatGPT 给出的答案是:一块砖的重量是 7.8125 千克。



    执行逻辑计算的代码解释器插件


    从早期用户研究来看,OpenAI 确定了代码解释器的几种重要用途:


    • 解决定量和定性类数学问题

    • 进行数据分析和可视化

    • 将文件转换为不同格式


    OpenAI 表示,希望这套模型能够运用自己的编程技能,为计算机中的基础功能提供更自然的使用界面。刚刚上手的初级程序员可以在它的帮助下大大提高工作效率,同时也希望能让更多受众接触并掌握编程技能。

    第三方插件


    一套知道该何时及如何使用插件的实验性模型。



    ChatGPT 中的第三方插件


    第三方插件由 manifest 文件做描述,其中包含对插件功能的机器可读描述和调用方法,同时提供面向用户的说明文档。



    待办事项管理插件的 manifest 文件示例


    插件的创建步骤如下:


    1. 用户使用希望语言模型调用的端点来构建 API(可以是新的 API、现有 API 或专为大语言模型设计的现有 API 打包器)。

    2. 为自己的 API 创建 OpenAPI 记录规范,同时创建一个指向 OpenAPI 规范并包含插件特定元数据的 manifest 文件。


    在 chat.openai.com 上开始对话时,用户可以指定想要启用的第三方插件。关于已启用插件的文档,将作为对话上下文的一部分被提交给语言模型,让模型能够根据需求调用适当的插件 API 以实现用户意图。目前的插件主要考虑对后端 API 的调用,OpenAI 也在探索如何让 API 调用客户端 API。

    开源检索插件


    开源检索插件让 ChatGPT 能够访问个人或组织信息源(经过许可)。它允许用户通过提问或用自然语言表达需求,从数据源处获取关联性最强的文档片段,包括文件、笔记、电子邮件或公共文档。


    作为开源加自托管方案,开发人员可以部署自己的插件版本并在 ChatGPT 上注册。检索插件利用 OpenAI 嵌入,允许开发人员选择矢量数据库(Milvus、Pinecone、Qdrant、Redis、Weaviate 或 Zilliz)来索引和搜索文档。信息源可使用 webhooks 与数据库保持同步。


    要体验这项功能,可以访问检索插件代码仓库:


    https://github.com/openai/chatgpt-retrieval-plugin

    ChatGPT 会杀死 Python 吗?


    添加插件后的 ChatGPT 能力大大增强,英伟达 AI 科学家 Jim Fan 激动地表示:如果说 ChatGPT 的登场是“iPhone 盛会”,那么今天第三方插件的集成就是“iOS App Store”盛会。也有网友认为,“今天开始我们已经进入 Chat OS 时代,ChatGPT=iOS”。


    微博大 V 木遥也感叹道“ChatGPT 推出插件功能可能是近期一系列进展中最令人惊讶和震撼的一个”。最后他发出预言:Python 已死。


    十年前,当一个人跃跃欲试要给新发布的 iPhone 写 APP 的时候,ta 必须自己是个非常老练的程序员才行。今天,当你跃跃欲试要给新发布的 GPT 平台写插件,你只要用自然语言描述你希望实现的效果就行了。OpenAI 的网站上有一个视频( player.vimeo.com/video/810996688?h=b552e96813)展示了如何在几分钟之内完全用自然语言跟 GPT 交互写一个让 AI 帮你记住私人 todo list 的插件。换句话说,这就是(至少作为胶水语言层级的)自然语言编程。

    如果这条路能走通,如果这成为行业标准,那么……

    Python 终于没有存在的意义了。撒花。


    添加插件后的 ChatGPT 真的会杀死 Python 吗?目前来看还不得而知,但正如云计算基础设施软件公司 HashiCorp 创始人 Mitchell Hashimoto 所说,OpenAl 设计的插件系统的确足够疯狂:


    “我开发过许多插件系统,OpenAl 设计的插件系统是我这辈子见过的最疯狂的系统。如果你要给它写插件,你并不是去写这个插件的程序,而是写一个关于插件的描述,只需用自然语言描述,然后 GPT 来帮你生成这个插件。”



    也有网友表示,“Python 把 GPT 推到台前,完成了历史使命。”“人人都是程序员的时代到了,而且是只需要掌握自然语言的程序员。”“利好文科生,能准确用语言文字清晰明了地表达自己的诉求成了第一生产力。”

    真安全还是说说而已?


    安全成为此次发布被多次提及的关键词。


    对于浏览插件,由于 ChatGPT 使用 Bing 搜索 API 从 Web 检索内容,因此 OpenAI 也继承了微软在这项工作中的基本原则:1)保证信息来源可靠且真实;2)通过“安全模式”防止检索有问题的内容。这款插件在独立服务中运行,能够保证 ChatGPT 的浏览活动与基础设施内的其余部分相互分离。


    为了尊重内容创作者并遵守网络规范,OpenAI 浏览器插件使用的用户代理令牌为 ChatGPT-User,并通过配置强调重新所访问网站的 robots.txt 文件。这偶尔会引发“click failed”问题,表明该插件正遵守目标网站的指示、避免执行抓取操作。此用户代理仅用于代表 ChatGPT 用户执行直接操作,不会以任何自动方式主动抓取网络内容。OpenAI 还发布了 IP 出口范围,并采取限速措施以避免向目标网站发出过多流量。


    OpenAI 的浏览插件会显示访问过的网站,并在 ChatGPT 的回复中引用其来源。由此实现的透明度层可帮助用户验证模型响应的准确性,并回馈内容创作者。


    对于代码解释器,OpenAI 表示之所以要将模型接入代码解释器,主要是想对执行过程做适当的沙盒处理,以确保 AI 生成的代码不会在现实场景中产生意外的副作用。OpenAI 称在安全环境中执行代码,并通过严格的网络控制来防止外部互联网访问到执行代码。此外,还对每个会话设置了资源限制。


    而检索插件允许 ChatGPT 搜索内容矢量数据库,并将最终结果添加至 ChatGPT 会话当中。这意味着它不会产生任何外部影响,主要风险只涉及数据授权和隐私。开发人员应确保只将有权使用的内容添加至检索插件,进而在用户的 ChatGPT 会话中共享。


    不过,网友对于 OpenAPI 的“安全宣传”似乎不太买单。


    网友 “mk_stjames” 表示:


    我对此有一些奇怪的感觉。从“傻瓜,当然它没有以任何方式连接到互联网!”到现在都没有一年的时间,变成“好的…所以我们连接到互联网…”

    首先是您的 API 调用,然后是您的 chatgpt-jailbreak-turns-into-a-bank-DDOS-attack,然后是“今天它以某种方式执行了 Python 脚本的数十万线程,该脚本在上午 8 点 31 分在纽约证交所导致自 1987 年以来最大的单日跌幅……”

    您可以继续讨论个人责任,所有…用户仍然是用户,对吧。但这开始感觉像是给一群黑猩猩上了膛的手枪。

    OpenAI 一直在谈论“安全”,但“安全”的全部意思是“好吧,我们不允许任何人允许它拿胖子或残疾人开玩笑,所以我们很好,对吧?!”


    当然,也有网友表示:为什么要对安全发牢骚呢?随它去吧!“如果你访问他们的 API,这基本上就是他们在做的事情,因为是否使用他们的审核端点取决于你。”不过这位网友也表示:“他们的‘人工智能安全’只是嘴上说说。在前几天,他们有一个 bug,你可以看到其他用户的聊天历史!”


    参考链接:


    https://openai.com/blog/chatgpt-plugins

    https://news.ycombinator.com/item?id=35277677


    2023-03-24 14:5915804

    评论

    发布
    暂无评论
    发现更多内容

    GitHub上13个高赞Java项目推荐,会一个就能跟面试官谈笑风生

    Java你猿哥

    Java 微服务 秒杀系统 网约车项目 java项目

    软件测试丨SeleniumIDE 自动化用例录制、测试用例结构分析

    测试人

    软件测试 自动化测试 测试开发 测试用例 selenium

    面试官:怎么保证Kafka的消息不丢失

    做梦都在改BUG

    Java kafka 面试 消息队列 消息中间件

    等保和网络安全法的关系是什么?怎么理解?

    行云管家

    网络安全 等保 等级保护

    分解GameFi链游游戏软件系统如何开发?

    Congge420

    Apache Hudi 在袋鼠云数据湖平台的设计与实践

    袋鼠云数栈

    数据湖 Hudi Apache Hudi

    JMeter笔记8 | JMeter关联

    测试 Jmeter 性能测试 自动化测试 接口测试

    浅谈NFT盲盒游戏系统开发原理

    Congge420

    NFTScan 正式发布 Bitcoin NFT 浏览器,支持 Ordinals NFT 和 BRC20 资产

    NFT Research

    Bitcoin NFT\

    火山引擎多云安全平台,破解多云异构场景下的安全挑战

    科技热闻

    开源赋能 普惠未来|XuperCore诚邀您参与2023开放原子全球开源峰会

    开放原子开源基金会

    开源

    JMeter笔记7 | JMeter脚本回放

    测试 Jmeter 性能测试 自动化测试 接口测试

    【技术】多端能力服务统一是一种关键的技术和架构

    没有用户名丶

    透明LED显示屏与常规屏的区别

    Dylan

    LCD1602液晶显示屏 显示器 LED显示屏

    在 Kubernetes 上实现高速应用交付

    NGINX开源社区

    nginx Kubernetes

    实力上榜!ONES 荣获深圳市「专精特新」企业认定

    万事ONES

    理解JVM工作机制(二) 对象的创建

    Geek漫游指南

    Java JVM Java web

    嘉为蓝鲸DevOps流水线工具如何为企业研发赋能?

    嘉为蓝鲸

    DevOps 流水线 蓝鲸

    火山引擎DataLeap联合DataFun发布《数据治理知识地图》

    字节跳动数据平台

    数据治理 数据开发 数据库开发 数据研发

    发挥数据价值!数据驱动的日志解析与异常检测方法介绍!

    嘉为蓝鲸

    日志分析 管理日志 日志统计

    开源赋能 普惠未来|铜锁/Tongsuo诚邀您参与2023开放原子全球开源峰会

    开放原子开源基金会

    开源

    ChatGPT聊天系统开发基于GPT-3.5架构

    Congge420

    Python从0到1丨了解图像形态学运算中腐蚀和膨胀

    华为云开发者联盟

    Python 人工智能 华为云 华为云开发者联盟 企业号 5 月 PK 榜

    零信任之访问代理

    Flomesh

    Pipy

    又爆神作!阿里首发并发编程神仙笔记,差距不止一点点

    做梦都在改BUG

    Java 并发编程

    SpringBoot 中实现定时任务的几种方式

    做梦都在改BUG

    Java Spring Boot

    嘉为蓝鲸CMP多云管理平台解决方案成功入选!

    嘉为蓝鲸

    多云管理 IT运维 蓝鲸

    【云计算】谷歌云是国外的吗?是公有云还是私有云?

    行云管家

    公有云 私有云 谷歌云

    理解JVM工作机制(三)对象的内存布局

    Geek漫游指南

    Java JVM

    开发者福利来了 | 京东云全系核心产品公开比价:我们承诺,买贵就赔!

    京东科技开发者

    数据库 云主机 京东云 云主机厂商 企业号 5 月 PK 榜

    ChatGPT联网终极进化!插件系统正式开放、无需编码就能上手,网友:这是我见过最疯狂的系统_语言 & 开发_褚杏娟_InfoQ精选文章