写点什么

云原生时代,推荐引擎架构有哪些挑战

  • 2021-09-11
  • 本文字数:1458 字

    阅读完需:约 5 分钟

云原生时代,推荐引擎架构有哪些挑战

在策划 AICon 人工智能与机器学习大会(2021.11.6-7 北京)的时候,首先想到的是推荐广告技术,不管是在工程技术还是在架构方面,也更符合 AI 技术的应用预期。在策划专题之初,我们去拜访了阿里巴巴智能引擎事业部算法平台负责人,阿里妈妈工程技术负责人 张迪(乐迪)老师,一起探讨了关于推荐和搜索的话题。

推荐引擎的核心技术和挑战


这几年整个推荐引擎的演变非常快,推荐引擎里面其实有三个核心的技术,一是召回技术,二是排序技术,三是机制技术,尤其是广告领域,它的机制属性是非常强的。


这三个技术对应到算法和架构上,就涉及到了召回技术,召回技术这几年变化非常多,最早的召回技术无论是搜索还是推荐,它本质上都是基于关键词的召回。搜索则是通过 search 关键词,Query 改写来进行召回。


之后兴起了各种各样的向量召回,更加丰富的把模型信息引入进来,向量化召回的本质是用模型在做匹配,但这个模型计算有很复杂的在线规则,因为在线无法完成大量的模型匹配,所以在线部分只留了一个比较经典的双塔结构,把下面所有的模型计算部分放到离线处理。但这也存在弊端,就是在线计算过于简单,很多个性化的东西会丢失,这也催生出新兴的技术,把越来越多的计算处理在线化,后来又出现像全库检索这样的技术,所以整个在线召回架构变化非常大。


在线 Ranking,这是在线里面最核心的一部分,随着模型的发展,计算量越来越大,如何支撑这种越来越大规模的在线 Ranking 计算,也是一个非常大的挑战。


而前面提到的机制,也正在往模型化的方向发展。以强化学习为例,推荐结构中推荐引擎的发展,和算法是一致的,算法越来越复杂的同时,给在线架构和计算量带来了非常多的挑战,对应衍生出了非常多的技术。

推荐引擎 & 云原生


关于推荐引擎,在整个容量管理和自动化偏向云原生,云原生其实是一个大的概念,但整体上它代表着更好的、越来越 Serverless 化,越来越多的业务的开发,和底层的分布式架构解藕带来了研发效率的提升,随着容量自动扩容,这个技术的影响力也越来越广泛。


另外,AI 算力的演化,召回的算力越来越强,Ranking 的算力越来越强,带来了整个架构上的挑战。举个例子,前几年兴起的超大规模模型的 server 问题,TB 级模型 server 问题,规模大意味着网络宽,而往深了探索,就要在单个芯片上把挖掘和编译优化做的越来越好,在离线都面临这样的问题。


分布式模型训练这个方向,仍然是非常重要的问题,如何把模型训练的更高效?除了把 SQL 做的越来越好之外,还有一个方向就是这几年百度、阿里、英伟达也在做的事情,就是用类似于 GPU pod 或者 AI 芯片 pod 来训练推荐模型,还是非常创新的,这是整个 Training 方向。在 Training 之上,其实有很多有意思的训练方式,就是训练的创新模型,比较经典的是前几年的 Graph Learning,还有联邦学习、双曲空间、Online Learning 都有很广的应用。


关于搜索引擎,整体上的趋势是越来越推荐化,搜索最大的特点是有个关键词,它基于关键词约束去做 Query,这是它最大的不同,但是现在越来越多的是把推荐的技术放进去,逐渐用算法的形式,然后不在关键词的约束下,在一个基本的相关性约束下去做推荐。

活动推荐:


除了上面聊到的一些技术演变之外,我们还讨论了在 AICon 会议上该如何将异构计算、推荐算法、沉浸事推荐多阶段排序技术结合业务场景来展示给听众,目前这些话题已经上线至官网了,感兴趣的可以移步至官网了解。


此外,AICon 还将围绕人工智能、通用机器学习、计算机视觉、智能金融技术、AI 团队建设、自动驾驶技术、NLP 技术、大规模机器学习等多个话题展开讨论,精彩内容持续上线中。

2021-09-11 13:001490

评论

发布
暂无评论
发现更多内容

word常用技巧 附word for mac永久安装包

理理

Word 2021破解版 Word 2019 word使用教程

淘宝官方商品、交易、订单、物流、插旗接口接入说明

tbapi

淘宝API 淘宝店铺订单接口 淘宝店铺订单详情接口 淘宝店铺订单物流接口 淘宝店铺订单列表接口

MES系统:企业工单管理难题的智能化钥匙

万界星空科技

mes 万界星空科技 工单管理 生产管理MES系统 生产工单

DDD-4-领域建模

南山

领域驱动设计 DDD 领域建模 领域模型

基于空域时空图卷积的步态情绪识别方法

天翼云开发者社区

云计算 云服务 卷积

pixelmator pro mac修图软件使用教程

理理

Mac修图软件 Pixelmator Pro破解 Pixelmator Pro中文 pixelmator pro教程

微信多开 WechatTweak for Mac(微信多开、消息防撤回工具)安装教程

理理

WeChatTweak 微信多开助手 微信多开

可图大模型再进化,实现AI试衣自由!

快手技术

AI技术

PS小白教程:如何在Photoshop中使用“渐变工具”?

理理

ps photoshop渐变 ps使用教程 photoshop2024下载安装

【云管小知识】云管平台可以纳管网络设备吗?

行云管家

云计算 云服务 云管理

走出舒适圈,将自动化智能技术作为财务增长的催化剂

智达方通

数字化转型 企业管理 全面预算管理 企业成长

DDD-3-领域模型

南山

领域驱动设计 DDD 领域模型

SD-WAN在教育行业的应用与优势解析

Ogcloud

SD-WAN 企业组网 SD-WAN组网 SD-WAN服务商 SDWAN

Go必知必会:其实学Go很简单。

王中阳Go

Go 编程 Go入门

个人博客导航如何创建更有个性化

博客趣

个人博客 博科趣 m.bokequ.com 博客导航

VOI云桌面与“无盘”是什么样的关系

上海锐起科技

桌面云 云桌面

与人类产生情感共鸣?数字华夏推出“夏澜”人形机器人;微软Azure AI语音服务推出虚拟人形象|AI日报

可信AI进展

DDD-5-统一语言

南山

领域驱动设计 DDD 领域驱动 统一语言

NFT数字藏品系统开发详细模式 数字藏品系统开发(开发源码)

V\TG【ch3nguang】

SD-WAN供应商有哪些类型?怎么选择?

Ogcloud

SD-WAN 企业组网 SD-WAN组网 SD-WAN服务商 SDWAN

AIGC时代,如何为“数据飞轮”提速

字节跳动数据平台

大数据 数据中台 数据治理 数据安全 数据研发

华为云低代码AstroZero技巧教学2:轮播组件的魅力 玩转视觉营销

华为云PaaS服务小智

低代码 华为云 网站设计

优化商品搜索关键词:基于API返回值的智能策略

代码忍者

API 测试 API】

LR专业级数字图像处理软件Lightroom Classic 2023中文直装版

理理

macbook触摸板辅助工具Bettertouchtool for Mac直装激活版

理理

触摸板辅助工具 Bettertouchtool破解版 Bettertouchtool mac Bettertouchtool mac下载

DriveDx for mac硬盘健康管理工具

理理

DriveDx Mac版

复制大量档案时Mac 进入睡眠模式会中断工作吗?

理理

虚拟化技术简介

天翼云开发者社区

云计算 虚拟化技术

Geekbench AI mac破解版 跨平台的 AI 基准测试

理理

AI Mac软件 基准测试 Geekbench AI

sketch使用教程:Sketch 快速复制图形的方法

理理

Sketch破解版 Sketch教程

大型数字化企业采购堡垒机的五个必要性

行云管家

数字化 数据安全 堡垒机

云原生时代,推荐引擎架构有哪些挑战_架构_Xue Liang_InfoQ精选文章