AICon上海|与字节、阿里、腾讯等企业共同探索Agent 时代的落地应用 了解详情
写点什么

飞桨文心大模型挑战高考作文:平均 1 秒生成 1 篇,水平超 75% 考生

  • 2022-06-10
  • 本文字数:1698 字

    阅读完需:约 6 分钟

飞桨文心大模型挑战高考作文:平均1秒生成1篇,水平超75%考生

全国高考正在进行中,百度 AI 技术也迎来一场“高考”。6 月 7 日,百度数字人度晓晓在高考语文考试结束后,化身为“数字人考生”,挑战高考作文写作。


AI 写作涉及自然语言处理、数据挖掘、知识图谱等多项人工智能技术,百度使用飞桨文心大模型支持度晓晓完成了高考作文的写作。


度晓晓参与作答了全国新高考Ⅰ卷题为《本手、妙手、俗手》议论文,40 秒就根据题目创作了 40 多篇文章,平均 1 秒生成 1 篇,随机抽取其中一篇,其分数已赶超约 75%高考考生。



文心大模型写作:平均 1 秒 1 篇,成绩超 75%考生


将 AI 应用于文字创作,在技术圈里早已不算新鲜事。随着大数据、深度学习等技术的发展,AI 在文本生成能力上有了大幅度提升。从财经、体育类新闻快讯,再到诗歌、小说等文学创作,AI 写作覆盖的领域越来越广,创作形式和内容也变得更加丰富多彩。


但相比于评论、摘要、快报等内容形式,用 AI 生成高考作文的难度显然更高。高考作文的写作在“审题”、“逻辑”和“创意”等三个方面对 AI 提出了更大的挑战。在审题层面,高考作文题材、形式众多,再加上纷繁复杂的内容主题,每一种千变万化的组合都是对 AI 的理解能力的极限考验。逻辑层面,高考作文要求 800 字以上,如何保证长文各个片段之间的逻辑性和连贯性对 AI 是另一大挑战。最后,在创意层面,可读性是高考作文最重要的评分标准之一,AI 写作不仅要切题连贯,还要善于引经据典、巧用修辞,甚至推陈出新,避免文章空洞乏味。


面对这些挑战,度晓晓在飞桨文心大模型的帮助指导下,又快又好地完成了写作。曾担任北京高考语文阅卷组组长的申怡为度晓晓的作文打出了 48 分的成绩(满分 60 分)。她表示,根据往年情况,获得 48 分及以上作文成绩的考生,仅占不到 25%,也就是说,度晓晓的作文分数已赶超约 75%高考考生。



这背后得益于文心大模型最新发布的融合任务相关知识的千亿大模型 ERNIE 3.0 Zeus,该模型在学习海量数据和知识的基础上,进一步学习百余种不同形式的任务知识,增强了模型的效果,在各类 NLP 任务上表现出了更强的零样本和小样本学习能力。通俗地讲,文心大模型就像个见多识广的“尖子生”、“学霸”,它的理解能力和创作能力比传统模型更强。不仅具备“倚马可待”的快速生产能力,还具备“下笔如有神”的质量保证。


在文心大模型的支持下,度晓晓完成的高考作文比以往有了明显的质量提升。首先,生成的作文能够紧扣主题、立意明确,度晓晓很好地理解了给定的作文题目,围绕主题进行文字的组织,佐证文章观点,输出对于主题积极正向的见解;然后在 800 字的长文本中,度晓晓能够保证生成的内容结构完整、语言流畅,并在开头引入和结尾扣题,上下文衔接流畅。同时,由于文心大模型具备更强的知识储备,度晓晓生成的作文更善于引经据典,并恰当使用排比、比喻等修辞手法,提升了文章的可读性。


不过,让申怡感到意外的是,度晓晓在作文里犯了个小错误——使用了网络热词 YYDS。而之所以会出现这样的“丢分点”,是因为度晓晓学习了一些热门网络数据。从生成文章的前后文看,度晓晓是领会了 YYDS 的“精髓”,本身用法贴切,但不太符合高考作文写作规范,也侧面反映了 AI 写作还可以继续学习、进步。


文心大模型助力智能创作,推动 AIGC 时代到来


过去一年,百度 AI 技术落地加速,其中尤以近来新兴的 AIGC 引人注目。AIGC 是继 UGC、PGC 之后一种新型的内容生产方式,指运用人工智能技术自动生产内容,数字人、TTV(Text to Video)等都是其标杆性应用。


百度研究院预测,2022 年 AIGC 技术将借助大模型的跨模态综合技术能力,可以激发创意,提升内容多样性,降低制作成本,实现大规模应用。


本次度晓晓写高考作文,就是基于飞桨文心大模型实现的 AIGC 创作。文心大模型具备“知识增强”的核心特点,能从大规模知识和海量数据中进行融合学习,学习效率更高、效果更好,具有通用性好、泛化性强的特点。


除了智能写作,在文心大模型的支持下,AI 已经具备了很强的理解和生成能力,能够实现创意作品的自动生成,包括 AI 作画、AI 写歌、AI 剪辑等。目前,智能作画、智能对话、智能创作、故事生成等大模型的创意应用已经上线文心大模型创意与探索社区——旸谷社区,搜索「文心大模型」即可进入官网进行体验。未来,基于大模型的 AIGC 将会开放赋能到更多的内容生产领域。

2022-06-10 17:033861
用户头像
刘燕 InfoQ高级技术编辑

发布了 1112 篇内容, 共 557.7 次阅读, 收获喜欢 1978 次。

关注

评论

发布
暂无评论
发现更多内容

什么是多云? 为什么我们需要多云可观测性 (Observability)?

NineData

多云服务 多云架构 多云管理 多云 多云多源

算启新程 智享未来,英特尔携中国移动为行业数字化转型提供新动能

E科讯

持续测试新范式:拨压测一体化

阿里巴巴云原生

阿里云 云原生 压测 拨测

基于Vue构建的快速开发框架

树上有只程序猿

Vue 低代码

Python 实训教学,更便捷的学生邀请及内容分发|ModelWhale 版本更新

ModelWhale

人工智能 数据分析 在线编程 高等教育 云课堂

SRM供应商招采系统(源码)

金陵老街

Zilliz X Dify.AI ,快速打造知识库 AI 应用

Zilliz

大模型 Zilliz LLM zillizcloud

语音识别技术:从传统到现代的飞跃

数据堂

文心一言 VS 讯飞星火 VS chatgpt (111)-- 算法导论10.2 2题

福大大架构师每日一题

福大大架构师每日一题

披荆斩棘的芒果 TV:基于 StarRocks 的云原生湖仓架构升级

StarRocks

如何有效改进erp管理系统?erp管理系统改进建议方向

优秀

ERP管理系统

数字时代的自我呈现:探索个人形象打造的创新工具——FaceChain深度学习模型工具

汀丶人工智能

人工智能 计算机视觉 图像生成

“鲸鸿动能·品牌共创计划”发布,多项权益助力品牌激发无限潜能

最新动态

简单聊聊低代码

互联网工科生

低代码 数字化

ETL数据转换方式有哪些?

RestCloud

数据同步 ETL

2023年10款好用的AI生成PPT软件盘点,干货建议收藏!

彭宏豪95

效率 软件 职场 PPT AIGC

LeetCode题解:1486. 数组异或操作,模拟,JavaScript,详细注释

Lee Chen

回归营销初心,2023金投赏鲸鸿动能专场聚焦品牌重塑

最新动态

邀你见证一本思维小册子的诞生:《豆哥宝典:思维模型》

豆哥

AI 思维模型 GPT 宝典

云桌面如何部署?云桌面系统方案部署详细教程

青椒云云电脑

云桌面 云桌面系统

​左手 Serverless,右手 AI,7 年躬身的古籍修复之路

阿里巴巴云原生

阿里云 Serverless 云原生

语音识别技术的优化与发展趋势

数据堂

哪家强?Bitget Wallet vs Metamask 从安全性能角度全方位 PK

股市老人

飞桨文心大模型挑战高考作文:平均1秒生成1篇,水平超75%考生_AI&大模型_刘燕_InfoQ精选文章