写点什么

国际机器学习顶会 ICML,我们来了!

  • 2019-08-26
  • 本文字数:1392 字

    阅读完需:约 5 分钟

国际机器学习顶会ICML,我们来了!

当地时间 6 月 9 日,机器学习领域最具影响力的学术会议之一 ICML 2019 在美国长滩隆重开幕。在本次 ICML 上,支付宝展示了多篇入选论文成果,并在 6 月 9 日举行了专家云集的主题 workshop,现场与各位学者专家探讨了前沿金融智能技术和应用的发展。



据了解,本次 workshop 围绕金融智能展开,会上 AI 专家围绕金融智能应用实践、“小数据”、数据隐私安全等焦点问题进行了演讲分享,助力行业解决人工智能+金融融合创新中的技术难题。


workshop 结束后,仍有大批专家学者们留在现场热情交流。



而论文方面,本届 ICML 支付宝 AI 技术团队贡献了多篇论文研究成果,包括提出了用生成对抗用户模型来解决强化学习小样本的问题,并将此方法用在推荐系统的优化中;引入了分布梯度时序插分学习,在分布强化学习的基础上开辟了新的方向;提出了粒子流贝叶斯定理(particle flow Bayes’Rule)算法,实现对高维贝叶斯推理的精确度的提升优化等。


以下我们精选了其中 3 篇为大家介绍,分享支付宝 AI 在金融服务领域的最新研究:

Adversarial User Model for Reinforcement Learning BasedRecommendation System

简介:将强化学习(RL)用于推荐系统,能更好地考虑用户的长期效益,从而保持用户在平台中的长期满意度、活跃度。但是,强化学习需要大量训练样本。在这篇论文中,我们提出用生成对抗用户模型(GAN user model)作为强化学习的模拟环境,先在此模拟环境中进行线下训练,再根据线上用户反馈进行即时策略更新,以此实现对线上训练样本需求的极大降低。

Nonlinear distributional gradient temporal differencelearning

简介:我们在该篇论文中引入了分布梯度时序插分学习(distributional gradient temporal difference learnig)。近年来分布强化学习例如 DeepMind 的 c51 算法引起了学术界的广泛注意。相较于传统的强化学习算法,分布强化学习考虑到长期奖励(long term reward)的分布信息,使得其具有学习过程更稳定,收敛速度更快的优点。但是与神经网络相结合以及使用 off-policy 学习后,分布强化学习的收敛性依旧难以得到保证。因此我们将分布强化学习与梯度时序插分学习相结合,提出了 Distributional Mean Squared Bellman Error 做为我们的优化目标函数。该研究为分布强化学习提供了理论保障同时在其基础上开辟了新的研究方向。

Particle Flow Bayes Rule

简介:贝叶斯推理(Bayesian Inference)在高维问题中,由于高维积分带来一系列的计算和精度问题,计算后验概率(posterior)是一个重大挑战。除此之外,在许多现实的问题中,观测数据(observations)按顺序依次到达,贝叶斯推断需要反复迭代使用:在观察一些数据后得到的后验概率可以当作新的先验概率,再根据新的数据得到新的后验概率。这种问题需要算法能在不储存大量历史数据的情况下,在线执行快速、有效的贝叶斯更新(Bayesian updating)。为解决这一具有挑战性的问题,我们提出了粒子流贝叶斯定理(particle flow Bayes’ Rule),这是一个基于常微分方程(ODE)的贝叶斯算子。我们在几个经典、高维实验中展示了通过 meta learning 训练得到的粒子流贝叶斯算子(particle flowBayes’ Rule)的有效性以及泛化能力。尤其在高纬问题中,我们提出的算法对后验的估算比已有的算法在精确度以及计算效率上有明显的优势。


本文转载自公众号蚂蚁金服科技(ID:Ant-Techfin)。


原文链接:


https://mp.weixin.qq.com/s/ISfL892oqYjc-eGMYwhUqw


2019-08-26 10:561133
用户头像

发布了 150 篇内容, 共 37.2 次阅读, 收获喜欢 38 次。

关注

评论

发布
暂无评论
发现更多内容

华为云桌面正协助企业快速进入云上数字化办公时代

轶天下事

微服务架构中的单一职责原则:构建高内聚、低耦合的服务

2756

微服务 微服务架构 单一职责

什么是WebAssembly及其必要性

谐云

WebAssenbly

WebAssembly:让Istio变得更强大

谐云

istio WebAssenbly

微服务架构概览图

wiflish

微服务 微服务架构 架构治理

AntDB数据库将携创新性解决方案亮相2023可信数据库发展大会

亚信AntDB数据库

数据库 AntDB AntDB数据库

稳定性和高可用如何兼顾,华为云网站高可用解决方案满足多方案需求

轶天下事

从头学Java17-Modules模块

烧霞

modules java17

数字化办公需求激增,华为云桌面解锁全新云办公模式

轶天下事

给新手产品经理的技术接口文档入门指南

Liam

产品 程序员 接口 API接口文档

红队攻防之快速打点

权说安全

网络攻防

自动化回归测试平台 AREX 0.4.0 版本发布

AREX 中文社区

开源 自动化测试 接口测试

企业数字化办公,华为云WeLink为何能脱颖而出

轶天下事

华为云WeLink——助力企业数字化办公降本增效,提升竞争力

轶天下事

大模型之Huggingface初体验

程序员架构进阶

Transformer 大模型 7月日更 7月月更 huggingface

云上办公时代,华为云会议如何保障企业的开会效率与数据安全?

轶天下事

避免“一选定终身”,那些从就读到就业的AI真相

脑极体

AI

华为云SparkPack:成长型企业的数字化转型利器

YG科技

内卷时代如何上云,华为云Web及移动App上云又有何亮点?

YG科技

Databend v1.2 版本发布!Data + AI

Databend

视频会议进入云时代,为何企业需要华为云会议

轶天下事

与 TDengine 性能直接相关——3.0 的落盘机制优化及使用原则

爱倒腾的程序员

涛思数据 tdengine 时序数据库

网页直播源码知识分享:“直播卫士”,查杀病毒功能在此!

山东布谷科技

软件开发 直播 源码搭建 网页开发 直播源码

安全是企业数字化的基石,华为云WeLink如何构建数字化办公护盾

轶天下事

云会议成为企业高频服务,华为云会议为何成为众多企业的选择?

轶天下事

从头学Java17-Lambda表达式

烧霞

Lambda java17

迭代失败的4个迹象,团队中了几个?快来看看如何解决!

敏捷开发

项目管理 Scrum 迭代 开发人员

国际机器学习顶会ICML,我们来了!_文化 & 方法_Geek_cb7643_InfoQ精选文章