AI 年度盘点与2025发展趋势展望,50+案例解析亮相AICon 了解详情
写点什么

从铁杵到绣花针:大模型可控生成的探索与思考

  • 2024-12-12
    北京
  • 本文字数:886 字

    阅读完需:约 3 分钟

从铁杵到绣花针:大模型可控生成的探索与思考

今年以来,AI 领域发生了多起因模型生成内容涉及种族偏见、虚假信息而引发的争议事件。这些事件凸显了大模型在生成结果上存在的可控性难题。


那么,如何突破这一限制,让大模型的产出不仅更加智能,还能更为精准地满足实际业务与用户需求?


在即将于本周五开幕的AICon全球人工智能开发与应用大会上,一场来自阿里国际大模型算法负责人骆卫华博士的主题演讲《从铁杵到绣花针:大模型可控生成的探索与思考》,将为大家揭开这道难题的面纱。


骆卫华博士目前担任阿里巴巴海外数字商业集团 AI 算法负责人,负责探索 AI 前沿技术与阿里国际业务相结合的最佳实践,并在此基础上研发 AI 创新技术。此前他在阿里巴巴达摩院负责机器翻译和多语言 NLP,搭建了服务于整个阿里国际业务的多语言翻译技术平台。加入阿里之前,他在中国科学院计算技术研究所从事 NLP 研究工作,并获得了中国科学院工学博士学位。


所谓“可控生成”,是指在大模型生成文本、图像或其他内容时,模型可以精准理解并执行用户给定的约束条件与规则。这意味着,当用户希望模型产生一篇具有特定论点结构的文章,或一张满足特定场景设定的商品展示图片时,模型不仅要完成“生成”这一基本任务,更要严格遵守条件,不能随意发挥或走题。


然而,当前主流的大语言模型和多模态模型在这一点上仍存在明显难题。许多模型虽能在大多数场景下给出相对合理的输出,但当用户的约束条件变得复杂,或者需要精确执行特定逻辑步骤时,模型的生成往往仍显“任性”:要么信息偏差,要么无法准确匹配用户设定的参数与限制,这在真实业务环境中必然引发后续问题。例如,在跨境电商中,为卖家自动生成商品详情页或广告描述时,如果模型不能精确地根据不同区域、文化的审美和政策要求进行生成,就可能出现内容不合规、调性不匹配等问题,大大降低 AI 赋能的实际价值。


在本次演讲中,骆卫华博士将介绍主流大模型在文本或图像生成时面临的可控性挑战,对部分现象成因的分析,并介绍阿里国际 AI 团队在优化可控生成方向上所作的创新探索工作。据悉,从今年开始,阿里国际开始在所有产品、所有区域商家端均上线了 AI 工具。


本次演讲不仅面向 AI 技术研究人员,更期待与有实际业务场景的从业者对话。



2024-12-12 10:4339

评论

发布
暂无评论

架构实战营模块二作业

哈啰–J

linux线上CPU100%排查

入门小站

Linux

三、应用高可用之数据设计

穿过生命散发芬芳

5月月更 高可用设计

dubbo + zookeeper + spring 分布式系统

爱好编程进阶

Java 程序员 后端开发

超级原始人系列盲盒即将上线,PlatoFarm赋能超多权益

BlockChain先知

#define定义标识符——定义宏——替换规则——##的作用—

爱好编程进阶

Java 程序员 后端开发

12 Steps to Better Code【改善代码的12步】

爱好编程进阶

Java 程序员

SecurityContextPersistenceFilter 过滤器链

急需上岸的小谢

5月月更

CGBTN2110-DAY02总结复习

爱好编程进阶

Java 程序员 后端开发

docker 基本知识

爱好编程进阶

程序员 后端开发

Docker从入门到干事,看这一篇就够了

爱好编程进阶

Java 程序员 后端开发

从火车票验票来说Flutter的网络请求会话管理

岛上码农

flutter 安卓开发 跨平台开发 ios 开发 5月月更

产品经理好用易上手的数据分析方法

龙国富

数据分析 产品经理

centos7

爱好编程进阶

Java 程序员 后端开发

Day146

爱好编程进阶

Java 程序员 后端开发

eclispe git 安装使用

爱好编程进阶

Java 程序员 后端开发

2020最新蚂蚁金服三面+HR一面,面试经验总结及分享

爱好编程进阶

Java 程序员 后端开发

微博系统中“微博评论”的高性能高可用计算架构

哈喽

「架构实战营」

DirectByteBuffer内存释放

爱好编程进阶

Java 程序员 后端开发

读《Software Engineering at Google》(25)

术子米德

架构师成长笔记

《深入理解计算机系统》读书笔记——第一章

如浴春风

5月月更

Docker Swarm从部署到基本操作

爱好编程进阶

Java 程序员 后端开发

LeetCode 24:交换链表

武师叔

5月月更

19 分布式缓存集群的伸缩性设计

爱好编程进阶

Java 程序员 后端开发

在线JSON转换成Excel文件工具

入门小站

工具

在 HarmonyOS 中实现 CircleImageView 库

海拥(haiyong.site)

鸿蒙 5月月更

[Day34-02]-[二叉树]从前序与中序遍历序列构造二叉树

方勇(gopher)

LeetCode 二叉树 数据结构和算法

win10搜索功能失效用不了如何解决

Sher10ck

实战:向GitHub提交代码时触发Jenkins自动构建

程序员欣宸

DevOps jenkins java 5月月更

ElasticSearch Client详解

爱好编程进阶

Java 程序员 后端开发

在线Excel转Text工具

入门小站

工具

从铁杵到绣花针:大模型可控生成的探索与思考_阿里巴巴_AICon 全球人工智能开发与应用大会_InfoQ精选文章