写点什么

FATE 发布 1.3 版本,首次增加联邦推荐算法

  • 2020-03-16
  • 本文字数:2024 字

    阅读完需:约 7 分钟

FATE发布1.3版本,首次增加联邦推荐算法

抗疫战场上的好消息不断传来,关于“数据免疫力”的话题也不断升温。企业和个人用户数据如何提高“免疫能力”,在越来越广泛的行业应用与合作中提升自身数据安全和防御能力?


近来,联邦学习进入行业视野。联邦学习在符合数据安全和政策法规的前提下,帮助各行各业实现多方协作训练 AI。FATE(Federated AI Technology Enabler)作为联邦学习首个工业级开源框架,实现了同态加密和多方计算(MPC)的安全计算协议,支持联邦学习架构,内置机器学习算法的联邦学习实现。


近日,FATE 发布了 2020 年的第一个版本更新 FATE v1.3。在这一版本中,FATE 首次增加联邦推荐算法模块 FederatedRec,该模块包含 6 大推荐场景中常用的算法,包括 5 种纵向联邦算法和 1 种横向联邦算法,可用于解决联邦学习场景下的推荐问题,比如评分预测,物品排序等。


此外,该团队与 VMware 中国研发开放创新中心云原生实验室的团队联合发布的 KubeFATE 也在这一版本中迎来更新,整体进行了重构,并引入了对最新版本的 FATE-Serving 支持,使得用户可以进行在线推理。最后,针对 FederatedML 等多个模块,新版本也进行了更新及优化。


项目 GitHub 地址:


https://ai.webankcdn.net/scvm/html/1579237806672.html

FederatedREC:提升算法预测效果,优化产品分发效率

在 FATE1.3 版本中,FATE 新增联邦推荐算法模块 FederatedRec,使得联邦推荐模块更加明确化,这一算法模块包含 6 大推荐场景的常用算法,主要有:


  • 纵向联邦算法 Hetero FM(Factorization Machine)

  • 横向联邦算法 Homo FM(Factorization Machine)

  • 纵向联邦算法 Hetero MF(Matrix Factorization)

  • 纵向联邦算法 Hetero SVD

  • 纵向联邦算法 Hetero SVD++

  • 纵向联邦算法 Hetero GMF(Generalized Matrix Factorization)


在这 6 类算法中,Hetero FM 和 Homo FM 分别是纵向联邦和横向联邦两种场景下的 FM(因式分解机)算法,该算法能够实现联合不同数据方的数据进行联合建模,对不同数据方直接进行显式的特征交叉和联合打分。


对于推荐场景下的算法,Hetero MF, Hetero SVD, Hetero SVD++和 Hetero GMF 提供了联邦建模下的协同过滤算法包。基于 FATE v1.3 提供的算法工具,能够实现不同数据方之间的 user-item,user-user 和 item-item 的矩阵分解。对开发者而言,通过联邦推荐这一模块,可以显著提升算法的预测效果及产品分发效率。

KubeFATE:支持 FATE-Serving 实现在线联邦推理,完全重构 Kubernetes

这一版本中,KubeFATE 也同步更新至 1.3,引入了对最新版本的 FATE-Serving 支持,使得用户可以进行在线推理,机器学习的常见功能进一步完善。对 KubeFATE 本身而言,这一版本也进行了彻底重构,主要有:


  • 支持完整的 FATE 集群生命周期管理,包括查询现在已部署的 FATE 集群列表,查看每个 FATE 集群的具体配置,对 FATE 集群配置进行更新,删除 FATE 集群等功能;

  • 实现 FATE 集群管理的任务框架,开发者可以细致追踪每个任务的子任务,方便定位基础设施层面的问题;

  • 分离 KubeFATE 的程序与 FATE 集群配置的关系,后续 FATE 更新版本后,开发者不需要每次都重新下载安装 KubeFATE 从而进行升级。理想网络状况下,KubeFATE 可以自动下载 FATE 集群的配置,开发者直接使用即可。如使用环境无网络支持,也可从 KubeFATE 的 Release 中下载 tgz 包,使用 KubeFATE 命令行直接上传到服务中,就可以实现部署发布新的集群支持。

  • 加强 FATE 模块化安装部署,这一版本中,KubeFATE 可以把 Exchange 或某几个模块单独部署为一个集群,通过 Kubernetes 联通起来。这一功能将有助于复杂 IT 环境的企业进行部署。


最后,在新版本中,KubeFATE 也会以服务的方式对外提供 RESTful API,对开发者而言,后续 KubeFATE 将以服务形式常驻对集群进行管理,命令行工具也可以在外网甚至 FATE 集群管理员的笔记本上运行。对外有 RESTful API 接口的功能如下图所示,都可以方便接入企业已有的云管系统。


FederatedML:训练稀疏数据效率提升,内存消耗再优化

除联邦推荐及 KubeFATE 的重点更新外,新版本针对 FederatedML 也做了进一步提升,在 1.3 中,纵向联邦广义线性模型(Hetero-LR、Hetero-LinR、Hetero-PoissonR)开始支持稀疏数据训练,开发者在训练稀疏数据时,能明显感到效率提升,内存消耗减少。解决分箱中 32M 限制,也使得特征分箱支持更高维度和更多样本的数据。纵向 SecureBoost 梯度直方图 32M 限制的解决,让 FATE 可以支持更高维度特征进行 secureboost 的训练。


总的来说,1.3 版本对 FATE 功能性及实践应用价值进行了强化,联邦推荐算法子模块 FederatedRec 的添加,对于用户而言,最明显的益处在于可以利用联邦推荐来提升自己算法的预测效果和产品的分发效率,使推荐服务的质量更上一个台阶。这对于第一方数据不够丰富,或者在业务的初始时期数据积累较少的用户方,是非常有帮助的。而 KubeFATE 也开启了 FATE 在生产环境,尤其是云原生环境上最优化管理使用的功能更新探索之路。后续,我们也将和 VMware 进一步合作,推出基于 FATE 的多方管理新项目。


2020-03-16 09:031674

评论

发布
暂无评论
发现更多内容

阿里云丁宇:以领先的云原生技术,激活应用构建新范式

阿里巴巴中间件

阿里云 云原生 应用构建

一文带你了解K8S 容器编排(下)

霍格沃兹测试开发学社

数据可视化系列教程之React组件使用技巧

云智慧AIOps社区

前端 React 数据可视化

利器 | Java 接口自动化测试首选方案:REST Assured 实践 (一)

霍格沃兹测试开发学社

代码分析体系及Sonarqube平台

霍格沃兹测试开发学社

软件测试 自动化测试 测试开发

软件测试 | 测试开发 | Pytest 测试框架,零基础也能轻松 hold 住

测吧(北京)科技有限公司

软件测试 测试

软件测试 | 测试开发 | Web服务端推送技术介绍

测吧(北京)科技有限公司

Web 软件测试

不懂PO 设计模式?这篇实战文带你搞定 PO

霍格沃兹测试开发学社

软件测试 自动化测试 测试开发

云架构系统如何做性能分析?| 实战干货

霍格沃兹测试开发学社

软件测试 自动化测试 测试开发

一文搞懂测试左移和测试右移的 Why-How-What

霍格沃兹测试开发学社

软件测试 自动化测试 测试开发

leetcode 114. Flatten Binary Tree to Linked List 二叉树展开为链表(简单)

okokabcd

LeetCode 算法与数据结构

利器 | 接口自动化测试框架 RESTAssured 实践(三):对 Response 结果导出

霍格沃兹测试开发学社

软件测试 自动化测试 测试开发

DevStream 社区贡献者英雄榜上线啦!

玩转Devop和研发效能DevStream/DevLake

开源 DevOps 开源社区 DevStream 开源运营

Github最新霸榜!Alibaba架构师手写的分布式系统核心原理手册

了不起的程序猿

Java 分布式 开发 分布式系统 java程序员

利器 | AppCrawler 自动遍历测试实践(三):动手实操与常见问题汇总

霍格沃兹测试开发学社

软件测试 自动化测试 测试开发

软件测试 | 测试开发 | 免安装免配置环境的免费 ios 调试工具 sib 来啦

测吧(北京)科技有限公司

ios 测试

隐私计算中的算子是个啥?可视化组合配置的算子解决方案了解下

Jessica@数牍

隐私计算 算子 隐私计算性能

Apache Hudi X Apache Kyuubi,中国移动云湖仓一体的探索与实践

网易数帆

大数据 Kyuubi Hudi LakeHouse 湖仓一体

代码质量管理平台实战| SonarQube 安装、配置及 JaCoCo、Maven 集成

霍格沃兹测试开发学社

软件测试 自动化测试 测试开发

数字藏品系统软件开发

开源直播系统源码

NFT 数字藏品 数字藏品系统软件开发 数字藏品app

利器 | REST Assured 实践(二):断言实现

霍格沃兹测试开发学社

软件测试 自动化测试 测试开发

一文彻底理解 Cookie、Session、Token

霍格沃兹测试开发学社

软件测试 自动化测试 测试开发

软件测试 | 测试开发 | HttpRunner初体验

测吧(北京)科技有限公司

软件测试 测试

程序员交接代码中被植入了恶意删除操作,太狠了!

程序员小毕

Java 程序员 面试 程序人生 码农

软件测试 | 测试开发 | 如何利用 xUnit 框架对测试用例进行维护?

测吧(北京)科技有限公司

软件测试

利器 | TestNG 与 Junit 对比,测试框架如何选择?

霍格沃兹测试开发学社

软件测试 自动化测试 测试开发

一文带你了解接口测试价值与体系

霍格沃兹测试开发学社

软件测试 自动化测试 测试开发

只懂黑盒测试也能学会的代码覆盖率及精准化测试

霍格沃兹测试开发学社

软件测试 自动化测试 测试开发

面试官:如何组装一个注册中心?

Java永远的神

编程 程序员 面试 微服务 注册中心

从 Linux 内核角度探秘 JDK NIO 文件读写本质

bin的技术小屋

Linux jdk nio Linux Kenel 文件I/O

你以为Shell只是命令行?读懂这篇文,给你的工作赋能

霍格沃兹测试开发学社

FATE发布1.3版本,首次增加联邦推荐算法_AI&大模型_Geek_684d95_InfoQ精选文章