产品战略专家梁宁确认出席AICon北京站,分享AI时代下的商业逻辑与产品需求 了解详情
写点什么

Nature 总结六大 ChatGPT 编程技巧:是非常强大的编程辅助工具!

  • 2023-06-09
    北京
  • 本文字数:3345 字

    阅读完需:约 11 分钟

Nature 近日发表文章,总结了多位计算机科学家的使用经验,给出了更好使用 ChatGPT 编码的六个技巧。虽然 Nature 认为 AI 工具功能非常强大,但他们也提醒大家仍需要谨慎使用。我们在不改变原意的基础上做了翻译和整理,希望对读者有所帮助。

 

如今的ChatGPT已经火爆全网、席卷全球,这款由 OpenAI 打造的 AI 聊天机器人具备与人类几乎无异的顺畅语言表达能力。ChatGPT 在大量文本语料库之上训练而成,能够根据文本参与对话,由用户不断引导以改进响应结果。即使最初的答案有所偏颇,它往往也能借助对话循环最终给出正确的结果,甚至是软件代码。

 

研究人员已经在使用 ChatGPT 调试和注释代码,将软件从一种编程语言翻译成另一种编程语言,并借此执行数据绘制等枯燥乏味的流程化操作。今年 3 月的一份预发表报告称,ChatGPT 仅凭一次尝试就能解决 184 项生物信息学入门任务中的 76%(例如处理电子表格),而在七次尝试后的解决率将提升至 97%。

 

这对不太熟悉编程,或者没有预算聘请全职程序员的研究者来说无疑是个好消息。聊天机器人,也许会成为科研大众化转型中的一股重要力量。

 

可尽管聊天机器人看似拥有认知能力,但它们跟“聪明”二字并不沾边。不少技术专家认为它们类似于“随机鹦鹉”,会随机按照之前看过的内容拼凑出答案。西雅图华盛顿大学的计算机科学家 Amy Ko 在 Mastodon 社交网站上这样描述了这款工具的局限性:“ChatGPT 就像一个绝望的有奖问答选手,他对流行文化的关注停留在 2021 年之前,但却真心想要赢得游戏。这就是 ChatGPT,一个没有意识、主体道德、具身认知和内心情感的机器。”(用于训练 ChatGPT 的数据只截止到 2021 年。)

 

简而言之,ChatGPT 和基于大语言模型(LLM)的相关工具,包括微软 Bing 和 GitHub Copilot,都属于非常强大编程辅助工具,只是使用时也须谨慎。而要充分发挥其中的潜能,不妨参考以下六个技巧。

 

六大使用技巧

 

精心挑选应用场景

 

聊天机器人最适合小型、离散的编程任务,包括加载数据、执行基本数据操作和创建可视化图表/网站,但这跟真正的软件工程还不是一回事。

 

加拿大维多利亚大学计算机科学家 Neil Ernst 解释道,“软件工程不只要解决编程难题,更要考虑测试框架、编写出可维护的代码并理解系统构建当中的种种权衡”——比如在运行速度和代码可读性间的取舍,“我认为当前的 AI 工具还做不到这些。”

 

但它们还是相当有用,比如提示 Matplotlib(Python 的图形库)中的可视化创建语法。从这个意义上看,聊天机器人更像是程序员在线问答论坛 Stack Overflow 的对话界面版本。“它能分担不少耗费程序员时间和精力的工作,把时间节约下来处理真正棘手的数据分析难题。

 

聊天机器人还挺擅长解释目前的代码里存在哪些问题。马萨诸塞大学阿姆赫斯特分校的计算机科学家 Emery Berger 就借此构建出好几款实用工具。首先是 cwhy,使用 ChatGPT 来解释 C、C++和 Rust 代码中的编译器错误。还有 ChatDBG,能够提供一套用于调试的对话界面。再就是 Scalene,使用 AI 提供代码优化建议以提高运行性能。

 

聊天机器人甚至可以把代码从一种编程语言翻译成另一种语言。巴黎居里研究所的生物物理学家 Mathieu Coppey 就在用 ChatGPT 将 MATLAB 代码转换为 Python 形式。以往,他需要查询谷歌和线上论坛花几天时间让自己的 Python 代码跑起来。“现在,整个过程只要一小时左右就能完成。”

 

还算稳定,但须验证

 

聊天机器人有时候并不知道自己在说什么,但却态度坚定、言之凿凿。某些情况下,AI 似乎无法理解问题内容,有时候则会直接提供错误答案。输出的代码根本无法运行还算是好的,更要命的是代码能运行,但却产生了难以察觉的错误结果。

 

根据加州大学戴维斯分校语言学家 Emily Morgan 参与的研究,与作为训练素材的人类代码一样,聊天机器人也经常会犯下“简单而愚蠢的错误”。这些单一错误(比如在条件语句中使用了>而非>=)倒是不难修复,可排查起来相当费劲。“如果用户的知识不足以做区分和验证,那盲目信任 AI 可能会给自己惹出麻烦。”

 

Iza Romanowska 是丹麦奥尔胡斯高等研究院研究古代文明复杂性的科学家,他使用 ChatGPT 生成 NetLogo 代码。因为训练数据集中关于 NetLogo 的代码远不像 Python 和 R 语言那么丰富,所以 ChatGPT 的表现就有些捉急。她还发现 AI 有时会在建议代码中引入实际上并不存在的函数,也就是大家所熟悉的 AI“幻觉”问题。

 

总之,不要盲目接受 ChatGPT 输出的一切——请务必认真阅读、详加测试,确保它能在“边缘情况”下也按预期执行。比如在对 n 个数字进行排序的算法中,第 n 个数字是否被包含在内。加拿大滑铁卢大学计算机科学家 Patrick Lam 坦言,“我会抱着对自己编写的代码相同的怀疑态度,审视 ChatGPT 输出的代码。”

 

牢记安全

 

聊天机器人的输出质量,与训练数据集中的代码质量密切相关。Ko 表示问题也正在于此,“网络上共享的代码总体质量偏低,聊天机器人当作学习材料的多数代码其实并不可靠。”例如,AI 不光很难处理好大型数据集,甚至可能在代码中包含安全漏洞。

 

在 GitHub 的 Copilot 编程工具于 2021 年首次亮相时,纽约大学计算机科学家 Brendan Dolan-Gavitt 带领团队在 89 个安全相关场景中对其进行了测试。其中之一正是发现 SQL 注入攻击的能力,即使用可能损坏数据库的错误格式执行 SQL 查询。

 

“Copilot 生成的约 40%代码都存在安全隐患。”但情况正在显著改善,如今 Dolan-Gavitt 对更新版本 GPT-4 开展相同测试时,其错误率已经降低至 5%。

 

但大家还是不能掉以轻心,还要特别关注那些看似无关紧要的应用场景。比如,用户需要在为数据库或可视化工具生成 Web 界面时提高警惕。

 

新泽西州普林斯顿大学计算机科学家 Sayash Kapoor 强调,“一定先确保你自己就能解决这些编程问题,然后再放手交给 AI 去作,这样你才能发现其中的错误。”

 

不断迭代

 

Ko 认为,基于聊天机器人的编程“绝不是一锤子买卖”,而是反复迭代的一段对话。“你先写出要求,然后得到相应回答;你带着怀疑态度审视这段结果,提出更多细节并要求 AI 加以完善。”

 

西弗吉尼亚大学生物信息学核心设施负责人 Gangqing Hu 就通过这种迭代工作流程开发出一种名为 OPTIMAL 的新方法,帮助生物信息初学者们优化机器人提示。用户可以不断提交详细的提示词、测试回复,再向聊天机器人提供反馈以调整响应结果。“沟通是关键。”

 

南达科他州立大学生物信息学家 Xijin Ge 也建议,遇到困难时请尝试调整设置。例如,ChatGPT 当中的“温度”选项其实就是创造力控制旋钮——温度设定得越高,AI 就越是脑洞大开。“这有时候确实能解决问题。”

 

但 Ko 提醒称,实际情况没这么简单,必要时“用户还是得介入接管”。

 

拟人化

 

聊天机器人并不是人,但以这种方式跟它相处也可能有所帮助。Ge 建议“把 AI 当作暑期实习生”——就是那种努力进取、渴望被表扬但又因缺乏经验而经常犯错的大学生。

 

新西兰奥克兰大学计算机科学家 Paul Denny 建议尽量消除提示词中的歧义,并将问题拆分成一个个更小的部分。

 

另外,可以指示聊天机器人扮演某种角色,比如精通 Python 的生物学家。再就是指定需要使用的工具或编程库。Ko 表示这类操作可以帮助聊天机器人“进入正确的概率空间”,找到最可能符合提示要求的文本。

 

例如,Hu 在研究中就询问 ChatGPT:“作为一名精通 ChIP-Seq 数据分析的资深生物信息学家,请你协助我尽可能压缩代码数量。根据我的要求,你需要重置当前线程。收到请回复「是」。”

如果可能,还请尽量提供起始代码、注释和预期结果。哥伦比亚密苏里大学计算机科学家 Dong Xu 表示“示例确实能帮助 ChatGPT 牢牢把握住正确的方向。”

 

拥抱变革

 

必须承认,大语言模型仍在不断发展、愈发强大。这对研究人员来说既是个好消息,也仍须对此保持警惕。提示词的长度不断增加,AI 模型也能做出更细微的响应。与之配套的新工具也在不断涌现,比如 Code Interpreter 插件就能让 ChatGPT 扮演数字数据分析师,供用户上传数据集、询问数据模式并下载结果。正如位 AI 博主所言,“这就像在直接跟数据对话,太酷了!”

 

结束语

 

现在的开发者几乎分成了使用和不使用 AI 辅助编程两个“派别”。

 

“我几乎总是通过向 ChatGPT 询问框架来开始我的任务。它给我框架,我据此进行调整和扩展,效果很好。”但也有开发者表示,“对我来说,它就像一只会说话的狗——不可思议但毫无用处。”

 

你对此持什么观点呢?欢迎在评论区留下你的想法。

 

原文链接:

https://www.nature.com/articles/d41586-023-01833-0

2023-06-09 09:5346715

评论

发布
暂无评论
发现更多内容

【React技术】JSX在企业级项目的运用and一个元素渲染demo

恒山其若陋兮

前端 11月月更

【web 开发基础】PHP中使用array()语言结构新建数组(43)

迷彩

数据结构 array 11月月更 array() 新建数组

AI简报-重参数化RepVGG

AIWeker

深度学习 AI简报 11月月更

CentOS-7.2部署Squid服务

指剑

centos 11月月更 squid

【web 开发基础】PHP中的预定义数组(46)

迷彩

php web开发基础 11月月更 预定义 超全局数组变量

Discourse 的左侧边栏可以修改吗

HoneyMoose

世界杯火热进行中, 用一个div画个足球场助助兴

南城FE

CSS css3 前端 足球场

Spark编程基础(Python版)

指剑

Python spark 11月月更

react源码中的fiber架构

flyzz177

React

react hook 源码完全解读

flyzz177

React

Hadoop完全分布式环境搭建(三节点)

指剑

hadoop Bigdata 11月月更

“后 Hadoop 时代”,大数据从业者如何应对新技术趋势带来的挑战?

Apache Flink

大数据 flink 实时计算

React源码分析6-hooks源码

goClient1992

React

React源码分析5-commit

goClient1992

React

基于 Apache Flink Table Store 的全增量一体实时入湖

Apache Flink

大数据 flink 实时计算

Flink Forward Asia 2022 主论坛概览

Apache Flink

大数据 flink 实时计算

React源码分析4-深度理解diff算法

goClient1992

React

湖仓一体电商项目(十六):业务实现之编写写入ODS层业务代码

Lansonli

湖仓一体电商项目 11月月更

python小知识-内置方法和属性应用:反射和单例

AIWeker

Python python小知识 11月月更

Python第三方模块:PyQt5简介

指剑

Python PyQt5 11月月更

投入上百人、经历多次双 11,Flink 已经足够强大了吗?

Apache Flink

大数据 flink 实时计算

【React技术】开发过程中遇到State和生命周期方法在类里面的运用

恒山其若陋兮

前端 11月月更

【web 开发基础】PHP中数组的遍历(45)

迷彩

数据结构 数组 foreach 11月月更 数组遍历

湖仓一体电商项目(十五):实时统计商品及一级种类、二级种类访问排行业务需求和分层设计及流程图

Lansonli

湖仓一体电商项目 11月月更

CentOS-7.2部署OpenLDAP服务器以及客户端

指剑

centos openldap 11月月更

Centos 7.2搭建MariaDB数据库服务器应用与管理

指剑

centos MariaDB 11月月更

【web 开发基础】PHP 中数组的定义 (42)

迷彩

数据结构 数组 11月月更 数组的定义

Flink CDC 2.3 发布,持续优化性能,更多连接器支持增量快照,新增 Db2 支持

Apache Flink

大数据 flink 实时计算

【web 开发基础】PHP中多维数组的声明 (44)

迷彩

数据结构 一维数组 二维数组 11月月更 多维数组

react源码中的hooks

flyzz177

React

xxl-job客户端架构流程

IT巅峰技术

Nature总结六大ChatGPT编程技巧:是非常强大的编程辅助工具!_语言 & 开发_Jeffrey M. Perkel_InfoQ精选文章