写点什么

阿里云企业 AI 搜索大模型关键技术优化实践 |QCon 北京

  • 2025-03-21
    北京
  • 本文字数:1744 字

    阅读完需:约 6 分钟

阿里云企业 AI 搜索大模型关键技术优化实践 |QCon北京

2025 年 4 月 10 - 12 日,QCon 全球软件开发大会将在北京召开,大会以 “智能融合,引领未来” 为主题,将汇聚各领域的技术先行者以及创新实践者,为行业发展拨云见日。


阿里云高级算法工程师姚舰航、徐光伟已确认出席并发表题为《阿里云企业 AI 搜索大模型关键技术优化实践》的主题分享。随着人工智能和深度学习的迅猛发展,大模型(Large Language Model)在自然语言处理、计算机视觉等领域取得了突破性的成果。这些进步促使搜索技术迎来了新的变革。传统搜索主要依赖于关键词匹配和预定义的规则,强调精确的相关性匹配。然而,AI 大模型的引入,使得搜索技术从关键词检索转向了语义理解,从单一模态走向了多模态融合,从确定性检索演变为基于相似度的智能检索。


本次演讲将聚焦于 AI 搜索大模型的关键技术应用,涵盖文本向量化、降维、重排序、NL2Search(自然语言到搜索)、文档解析与切片、问答大模型评测与微调、 Agentic RAG(检索增强生成)及客户专属大模型的最新进展。具体将结合实际业务场景和案例(如智能问答系统、文档搜索、人工智能助手等),深入阐述这些技术如何提升搜索的质量和效率,以及在实践中如何克服各种技术挑战。


姚舰航是浙江大学自动化控制专业硕士,毕业后一直从事搜广推算法研究与应用工作。涉及信息流推荐、商业化广告定向 DMP、OCPX 深度转化模型优化以及云上智能推荐等领域,具备丰富的 C 端和 B 端算法优化和实践经验。目前专注于企业级 AI 搜索方向,负责搜索专属大模型训练以及 Agentic RAG 能力建设。


徐光伟在搜索技术和 NLP 算法方向有十年以上的经验,共有 20 篇以上的顶会论文发表和 50 篇以上的专利,拿到 MS MARCO 和 TREC 2022 文档检索的冠军、NL2SQL 任务 BIRD 榜单的冠军。在 to B 业务方向有八年的经验,搜索云服务业务上推动了行业版算法效果超越竞品,创新地提出轻量化客户定制与多模态检索的产品功能持续迭代,赢得多个标杆客户的认可。


本次大会,两位讲师分享的详细演讲内容如下:


演讲提纲

  • AI 大模型在搜索领域的背景与趋势

  • 文本向量化与降维

  • 搜索结果的重排序模型

  • NL2Search:从自然语言到搜索

  • 基于大模型的语义切片

  • 大模型问答质量评测与微调

  • Agentic RAG 实践

  • 客户专属大模型训练探索

您认为,这样的技术在实践过程中有哪些痛点?

  • 文本向量化与降维:向量化可能导致高维数据难以处理,而降维可能导致信息丢失,影响搜索效果

  • 重排序算法:需要高效的算法以确保实时性,尤其是在大规模数据集上,但计算复杂度可能成为瓶颈

  • NL2Search(自然语言到搜索):构建高质量的自然语言处理模型需要大量标注数据,且模型的准确性对于搜索体验非常关键

  • 基于大模型的语义切片:切片语义完整度直接影响搜索结果的相关性

  • 大模型问答质量评测与微调:大模型问答缺乏全面且高精度的质量评测体系,大模型在 AI 搜索场景中仍存在幻觉、回答不完整、回答冗余等问题

  • Agentic RAG 实践:单轮 RAG 难以解答复杂问题(如多跳问题、聚合问题等)

  • 客户专属大模型训练:由于大模型缺乏客户专有域知识,对客户场景特有问题的理解不足,回答不专业

演讲亮点

  • 实际业务场景结合:通过智能问答系统和文档搜索案例,展示 AI 搜索技术如何在现实中应用,增强观众理解

  • 前沿技术进展:介绍 Agentic RAG 的最新进展,帮助听众了解技术的未来发展趋势

  • 技术问题与解决方案:不仅指出各项技术的实际痛点,还提供了相应的解决策略,使内容更加实用

  • 综合性讨论:涵盖从文本向量化到问答大模型的多个技术层面,提供全方位的知识视角

听众收益

  • 深入了解 AI 搜索大模型的核心技术和应用场景,掌握最新的行业动态和技术趋势

  • 学习如何将大模型技术应用于实际业务中,解决传统搜索难以应对的问题,提升系统的智能化水平

  • 开拓新的思路和方法,了解如何结合传统技术和大数据处理,实现高效的搜索解决方案

  • 了解当前领域的技术挑战,为未来在 AI 搜索领域的研究和实践提供指引


除此之外,本次大会还策划了多模态大模型及应用AI 驱动的工程生产力面向 AI 的研发基础设施不被 AI 取代的工程师大模型赋能 AIOps云成本优化Lakehouse 架构演进越挫越勇的大前端等专题,届时将有来自不同行业、不同领域、不同企业的 100+资深专家在 QCon 北京现场带来前沿技术洞察和一线实践经验。


现在报名即可以享受 9 折优惠,单张门票立省 680 元,详情可扫码或联系票务经理 18514549229 咨询。



2025-03-21 17:041

评论

发布
暂无评论
发现更多内容

如何设计一个高并发系统?这篇文章全部给你讲清楚了

Java永远的神

程序员 面试 后端 高并发 架构师

CodeLab:一款让你体验丝滑般的云化JupyterLab

华为云开发者联盟

人工智能 华为云 企业号九月金秋榜

软件测试 | 测试开发 | java远程连接ssh的实现

测吧(北京)科技有限公司

java;

Apache Hudi X Apache Kyuubi,中国移动云湖仓一体的探索与实践

网易数帆

大数据 Kyuubi Hudi LakeHouse 湖仓一体

程序员交接代码中被植入了恶意删除操作,太狠了!

程序员小毕

Java 程序员 面试 程序人生 码农

JDBC系列——JDBC编程六步

胖虎不秃头

MySQL 数据库 9月月更

MySQL系列——连接查询、子查询、union合并、limit

胖虎不秃头

MySQL 数据库 9月月更

软件测试 | 测试开发 | 免安装免配置环境的免费 ios 调试工具 sib 来啦

测吧(北京)科技有限公司

ios 测试

OpenHarmony3.0如何轻松连接华为云IoT设备接入平台

华为云开发者联盟

后端 物联网 华为云 企业号九月金秋榜

软件测试 | 测试开发 | Pytest 测试框架,零基础也能轻松 hold 住

测吧(北京)科技有限公司

软件测试 测试

MySQL系列——数据库表、查询、排序、数据处理函数

胖虎不秃头

MySQL 数据库 9月月更

软件测试 | 测试开发 | HttpRunner初体验

测吧(北京)科技有限公司

软件测试 测试

面试官:如何组装一个注册中心?

Java永远的神

编程 程序员 面试 微服务 注册中心

软件测试 | 测试开发 | 如何利用 xUnit 框架对测试用例进行维护?

测吧(北京)科技有限公司

软件测试

BI系统的分布式部署原理和技术实现

葡萄城技术团队

分布式 BI 部署 可视化数据

堡垒机定义、由来以及价值简单说明-行云管家

行云管家

网络安全 数据安全 堡垒机 行云管家

探索编译软件栈新范式;高端GPU禁售的影响;陈天奇DL系统免费课程|AI系统前沿动态

OneFlow

内容合集

日志易正式加入华为云云商店联营模式,并受邀参与首届828 B2B企业节

IT资讯搬运工

华为 华为云

GaussDB(for Redis)双活容灾支持4大应用场景,全新守护业务安全

华为云开发者联盟

数据库 后端 企业号九月金秋榜

只懂黑盒测试也能学会的代码覆盖率及精准化测试

霍格沃兹测试开发学社

软件测试 自动化测试 测试开发

利器 | 接口自动化测试框架 RESTAssured 实践(三):对 Response 结果导出

霍格沃兹测试开发学社

软件测试 自动化测试 测试开发

从 Linux 内核角度探秘 JDK NIO 文件读写本质

bin的技术小屋

Linux jdk nio Linux Kenel 文件I/O

NFT软件开发:什么是数字藏品?

开源直播系统源码

NFT 数字藏品 数字藏品系统软件开发 数字藏品开发

备战2023秋招,应届生应做好哪些准备

C++后台开发

应届生 C++后台开发 校招 秋招 C++开发

Python 自动化测试(五): Pytest 结合 Allure 生成测试报告

测吧(北京)科技有限公司

Python 自动化测试 pytest

一文带你了解K8S 容器编排(下)

霍格沃兹测试开发学社

大咖说 | 无影携手实在智能助力企业“数智化”转型

大咖说

无影 实在智能

字节一面:服务端挂了,客户端的 TCP 连接还在吗?

Java全栈架构师

程序员 面试 TCP 计算机网络 秋招

DevStream 社区贡献者英雄榜上线啦!

玩转Devop和研发效能DevStream/DevLake

开源 DevOps 开源社区 DevStream 开源运营

负载均衡

阿柠xn

负载均衡 运维 MQ 9月月更

软件测试 | 测试开发 | Web服务端推送技术介绍

测吧(北京)科技有限公司

Web 软件测试

阿里云企业 AI 搜索大模型关键技术优化实践 |QCon北京_阿里巴巴_QCon全球软件开发大会_InfoQ精选文章