写点什么

国际机器学习顶会 ICML,我们来了!

  • 2019-08-26
  • 本文字数:1392 字

    阅读完需:约 5 分钟

国际机器学习顶会ICML,我们来了!

当地时间 6 月 9 日,机器学习领域最具影响力的学术会议之一 ICML 2019 在美国长滩隆重开幕。在本次 ICML 上,支付宝展示了多篇入选论文成果,并在 6 月 9 日举行了专家云集的主题 workshop,现场与各位学者专家探讨了前沿金融智能技术和应用的发展。



据了解,本次 workshop 围绕金融智能展开,会上 AI 专家围绕金融智能应用实践、“小数据”、数据隐私安全等焦点问题进行了演讲分享,助力行业解决人工智能+金融融合创新中的技术难题。


workshop 结束后,仍有大批专家学者们留在现场热情交流。



而论文方面,本届 ICML 支付宝 AI 技术团队贡献了多篇论文研究成果,包括提出了用生成对抗用户模型来解决强化学习小样本的问题,并将此方法用在推荐系统的优化中;引入了分布梯度时序插分学习,在分布强化学习的基础上开辟了新的方向;提出了粒子流贝叶斯定理(particle flow Bayes’Rule)算法,实现对高维贝叶斯推理的精确度的提升优化等。


以下我们精选了其中 3 篇为大家介绍,分享支付宝 AI 在金融服务领域的最新研究:

Adversarial User Model for Reinforcement Learning BasedRecommendation System

简介:将强化学习(RL)用于推荐系统,能更好地考虑用户的长期效益,从而保持用户在平台中的长期满意度、活跃度。但是,强化学习需要大量训练样本。在这篇论文中,我们提出用生成对抗用户模型(GAN user model)作为强化学习的模拟环境,先在此模拟环境中进行线下训练,再根据线上用户反馈进行即时策略更新,以此实现对线上训练样本需求的极大降低。

Nonlinear distributional gradient temporal differencelearning

简介:我们在该篇论文中引入了分布梯度时序插分学习(distributional gradient temporal difference learnig)。近年来分布强化学习例如 DeepMind 的 c51 算法引起了学术界的广泛注意。相较于传统的强化学习算法,分布强化学习考虑到长期奖励(long term reward)的分布信息,使得其具有学习过程更稳定,收敛速度更快的优点。但是与神经网络相结合以及使用 off-policy 学习后,分布强化学习的收敛性依旧难以得到保证。因此我们将分布强化学习与梯度时序插分学习相结合,提出了 Distributional Mean Squared Bellman Error 做为我们的优化目标函数。该研究为分布强化学习提供了理论保障同时在其基础上开辟了新的研究方向。

Particle Flow Bayes Rule

简介:贝叶斯推理(Bayesian Inference)在高维问题中,由于高维积分带来一系列的计算和精度问题,计算后验概率(posterior)是一个重大挑战。除此之外,在许多现实的问题中,观测数据(observations)按顺序依次到达,贝叶斯推断需要反复迭代使用:在观察一些数据后得到的后验概率可以当作新的先验概率,再根据新的数据得到新的后验概率。这种问题需要算法能在不储存大量历史数据的情况下,在线执行快速、有效的贝叶斯更新(Bayesian updating)。为解决这一具有挑战性的问题,我们提出了粒子流贝叶斯定理(particle flow Bayes’ Rule),这是一个基于常微分方程(ODE)的贝叶斯算子。我们在几个经典、高维实验中展示了通过 meta learning 训练得到的粒子流贝叶斯算子(particle flowBayes’ Rule)的有效性以及泛化能力。尤其在高纬问题中,我们提出的算法对后验的估算比已有的算法在精确度以及计算效率上有明显的优势。


本文转载自公众号蚂蚁金服科技(ID:Ant-Techfin)。


原文链接:


https://mp.weixin.qq.com/s/ISfL892oqYjc-eGMYwhUqw


2019-08-26 10:561187
用户头像

发布了 150 篇内容, 共 38.4 次阅读, 收获喜欢 38 次。

关注

评论

发布
暂无评论
发现更多内容

iLogtail 开源两周年:社区使用调查报告

阿里巴巴云原生

阿里云 云原生 iLogtail

mac电脑办公必备软件:PDF Reader Pro 全能pdf编辑工具

Rose

人工智能 | 大语言模型应用框架介绍

测吧(北京)科技有限公司

测试

生产进度拖延、成本高企,你还愿意继续忍受吗?

天津汇柏科技有限公司

低代码开发平台 软件定制开发 AI人工智能 生产管理

2024年石家庄等保测评机构名单汇总

行云管家

数据安全 等保 石家庄

2023年央企安全威胁盘点

芯盾时代

身份安全 央国企数字化转型 弱口令

亚信安慧AntDB-T数据库内核之MVCC机制

亚信AntDB数据库

AntDB 企业号 月PK

电商数据驱动决策:京东商品详情API返回值的力量

技术冰糖葫芦

api 网关 API Explorer API 策略 pinduoduo API

零基础能做Oracle数据库之间的迁移吗?

NineData

oracle 数据迁移 Oracle ACE NineData 增量迁移

应用开发“取经路”,华为应用市场送出全周期服务“助攻”

脑极体

AI

Sublime Text(代码编辑器) 中文汉化版设置教程

Rose

实践分享:借助Leangoo领歌免费敏捷工具精细化Sprint Backlog管理

顿顿顿

敏捷开发 敏捷项目管理 敏捷工具 scrum工具 敏捷迭代管理

历经三年磨砺,快手交换机的自研创新之路

快手技术

五连冠!浪潮云洲连续五年稳居中国工业互联网平台市场"双料第一"

财见

多模态在京东内容算法上的应用

京东零售技术

算法

更懂消费者 火山引擎数据飞轮助力乳企做好雪糕生意

字节跳动数据平台

大数据 数据分析 数据平台 火山引擎 增长营销

国际营销服务内容

cts喜友科技

营销 通讯 国际营销

XTransfer技术专家亮相2024MongoDB中国用户大会

XTransfer技术

兼容M1/M2 Mac SVN客户端 Cornerstone for Mac v4.2永久激活版

Rose

电商创新:基于亚马逊国际商品详情API返回值的策略

技术冰糖葫芦

api 网关 API Explorer API 策略 pinduoduo API

从申请到调用:一步一步教你使用1688商品列表数据接口

tbapi

1688API 1688商品列表数据接口

Azentio通过收购科威特公司Pysurance和iMOTOR,引领保险技术现代化

财见

人工智能 | 大语言模型应用框架介绍

测试人

人工智能 软件测试

软件正在我们眼前悄然被侵蚀

财见

GreatSQL执行Update失败案例分析

GreatSQL

火山引擎携手南开大学、中国国航、协和医院,加速各行业AI能力落地

新消费日报

快切云桌面助力新业务快速上线!

上海锐起科技

实力上榜 | 软通动力入选"2024数据要素服务商排行"榜单

财见

家居装修行业怎么定义?是否需要堡垒机?

行云管家

网络安全 堡垒机 装修行业

国际机器学习顶会ICML,我们来了!_文化 & 方法_Geek_cb7643_InfoQ精选文章