写点什么

从铁杵到绣花针:大模型可控生成的探索与思考

  • 2024-12-12
    北京
  • 本文字数:886 字

    阅读完需:约 3 分钟

从铁杵到绣花针:大模型可控生成的探索与思考

今年以来,AI 领域发生了多起因模型生成内容涉及种族偏见、虚假信息而引发的争议事件。这些事件凸显了大模型在生成结果上存在的可控性难题。


那么,如何突破这一限制,让大模型的产出不仅更加智能,还能更为精准地满足实际业务与用户需求?


在即将于本周五开幕的AICon全球人工智能开发与应用大会上,一场来自阿里国际大模型算法负责人骆卫华博士的主题演讲《从铁杵到绣花针:大模型可控生成的探索与思考》,将为大家揭开这道难题的面纱。


骆卫华博士目前担任阿里巴巴海外数字商业集团 AI 算法负责人,负责探索 AI 前沿技术与阿里国际业务相结合的最佳实践,并在此基础上研发 AI 创新技术。此前他在阿里巴巴达摩院负责机器翻译和多语言 NLP,搭建了服务于整个阿里国际业务的多语言翻译技术平台。加入阿里之前,他在中国科学院计算技术研究所从事 NLP 研究工作,并获得了中国科学院工学博士学位。


所谓“可控生成”,是指在大模型生成文本、图像或其他内容时,模型可以精准理解并执行用户给定的约束条件与规则。这意味着,当用户希望模型产生一篇具有特定论点结构的文章,或一张满足特定场景设定的商品展示图片时,模型不仅要完成“生成”这一基本任务,更要严格遵守条件,不能随意发挥或走题。


然而,当前主流的大语言模型和多模态模型在这一点上仍存在明显难题。许多模型虽能在大多数场景下给出相对合理的输出,但当用户的约束条件变得复杂,或者需要精确执行特定逻辑步骤时,模型的生成往往仍显“任性”:要么信息偏差,要么无法准确匹配用户设定的参数与限制,这在真实业务环境中必然引发后续问题。例如,在跨境电商中,为卖家自动生成商品详情页或广告描述时,如果模型不能精确地根据不同区域、文化的审美和政策要求进行生成,就可能出现内容不合规、调性不匹配等问题,大大降低 AI 赋能的实际价值。


在本次演讲中,骆卫华博士将介绍主流大模型在文本或图像生成时面临的可控性挑战,对部分现象成因的分析,并介绍阿里国际 AI 团队在优化可控生成方向上所作的创新探索工作。据悉,从今年开始,阿里国际开始在所有产品、所有区域商家端均上线了 AI 工具。


本次演讲不仅面向 AI 技术研究人员,更期待与有实际业务场景的从业者对话。



2024-12-12 10:439292

评论

发布
暂无评论
发现更多内容

DevOps到底是什么意思?

xcbeyond

DevOps 方法论 软件测试 28天写作

阿里云重磅发布云拨测产品:深度挖掘数据,精准定位 IT 问题

阿里巴巴中间件

2021直播电商下半场,“网易严选们”为何成主播良港?

脑极体

微服务“大门”如何选择?

阿里巴巴中间件

DjangoRestFramework框架简介及基本使用

行者AI

RESTful

技术资讯 | 百度智能云拿下MTCS最高安全评级

百度开发者中心

行业资讯

产业区块链蓬勃发展 联盟链成为落地应用最大杀器

CECBC

区块链

宙斯运维平台简述,看数十万云服务器如何高效运维?

李忠良

28天写作

数学,离一个程序员有多近?

小傅哥

程序员 面试

悟透前端 | javascript中变量声明var、let、const的区别

devpoint

var const let js变量声明

IDEA Malformed argument has embedded quote

会飞的猪

IDEA

我国首个自主可控区块链软硬件技术体系发布

CECBC

区块链

《我们一起学集合》-ArrayList

蚊子

数据结构 面试 ArrayList JAVA集合

在游戏运营行业,函数计算如何解决数据采集分析痛点?

阿里巴巴中间件

当视频恋爱 App 用上了 Serverless

阿里巴巴中间件

Spring Security 实战干货:分布式对象SharedObject

Java spring 分布式

七面阿里成功offer,入职就是25k*16薪,还原我的大厂面经

Java 程序员 面试

“复制”马斯克(二):“一无所有”的世界首富想要什么?

脑极体

智能电动车的估值模式及电气架构变迁 (28天写作 Day21/28)

mtfelix

汽车电子 28天写作 智能汽车 汽车电气架构

《携程技术2020年度合辑》,送给爱学习的你

携程技术中心

LeetCode题解:200. 岛屿数量,DFS,JavaScript,详细注释

Lee Chen

算法 大前端 LeetCode

“删库跑路”,这背后的数据安全你悟到了吗?

BinTools图尔兹

数据库 大数据 数据安全 数据库管理工具 删库

北京朝阳法院借力区块链化解物业纠纷

CECBC

法院调解

阿里直招怒斩“P7“offer,自曝狂啃六遍的面试笔记

Java架构之路

Java 程序员 架构 面试 编程语言

加油,成功通过阿里P7Java岗面试,分享一些面试心得

Java架构之路

Java 程序员 架构 面试 编程语言

服务网格的最佳实践

阿里巴巴中间件

Elastic开源协议改了,用户怎么办?

星环科技

编程小技巧之 Linux 文本处理命令(二)

程序员历小冰

Linux 编辑器 sed

讲真,一位8 年 Java 经验大牛的面试总结,你照猫画虎还怕收不到offer?

Java架构之路

Java 程序员 架构 面试 编程语言

CSS(七)——设置背景颜色和背景图像

程序员的时光

程序员 大前端 七日更 28天写作

2021年了,还听到有些兄弟在问Kafka香不香?

后台技术汇

28天写作

从铁杵到绣花针:大模型可控生成的探索与思考_阿里巴巴_AICon 全球人工智能开发与应用大会_InfoQ精选文章