写点什么

Google 发布 MultiModel:能够学习不同领域多任务的神经网络

  • 2017-07-19
  • 本文字数:829 字

    阅读完需:约 3 分钟

Google 开发了一种可以接受多种形式输入并能生成多种形式输出的算法。

目前,大部分机器学习应用程序都只能关注一个领域。机器翻译一次只能建立一个语言对的模型,而图像识别算法一次只执行一个任务(例如描述图像、判断图像所属类别或在图像中查找对象)。然而,我们的大脑在执行所有任务时都能表现得很好,并且能够将知识从一个领域转移到另一个领域。大脑甚至可以将通过听学到的知识转换成其他领域的知识:看到或者读到的知识。

Google 开发了一个能够执行8 个不同领域任务的模型:语音识别、图像分类和添加标题、句法解析、英德互译和英法互译。这个模型由编码器、解码器和“输入输出混频器”组成,其中“输入输出混频器”会将先前的输入和输出馈送到解码器。如下图所示,每个“花瓣”表示一种形式(声音、文本或图像)。神经网络可以通过任意一种输入和输出的形式来学习每个任务。

2016 年 11 月,Google 发布了 zero-shot 翻译。该算法将所有句子映射到“中间语言”,“中间语言”指的是一种对于每种输入语言和输出语言都相同的句子。Google 只针对英韩语言对和英日语言对进行了训练,也就是说这个神经网络并未学习过对应的日韩语言对,但这时这个神经网络就能够进行日韩互译了。

Google 报告称,使用 MultiModel 时使用少量训练数据的任务表现更好。机器学习模型通常在使用更多训练数据的时候表现更好。使用 MultiModel 可以从多个领域获取额外的数据。需要注意的是,使用这种方法并没有打破标准任务任何已有的记录。

MultiModel 作为 Tensor2Tensor 库的一部分在 GitHub 开源。有关这个模型更详细的方法和研究结果可以在 arxiv.com 的论文 One Model To Learn Them All 中找到。

查看英文原文: Google Presents MultiModel: A Neural Network Capable of Learning Multiple Tasks in Multiple Domains


感谢冬雨对本文的审校。

给InfoQ 中文站投稿或者参与内容翻译工作,请邮件至 editors@cn.infoq.com 。也欢迎大家通过新浪微博( @InfoQ @丁晓昀),微信(微信号: InfoQChina )关注我们。

2017-07-19 19:001765
用户头像
蔡芳芳 InfoQ主编

发布了 802 篇内容, 共 569.7 次阅读, 收获喜欢 2796 次。

关注

评论

发布
暂无评论
发现更多内容

Self-Compassion,对自己好一点

霍太稳@极客邦科技

创业 个人成长 自我管理 创业心态

Java如何调用Python(二)

wjchenge

技术​选型的艺术

YourBatman

技术选型 湖北

挑战10的1,143,913次方种算法组合:这都不是事儿!

华为云开发者联盟

华为 算法 进化 华为云

架构感悟 7- 性能优化何为

旭东(Frank)

web 性能压测工具

Z冰红茶

数字货币并不能完美诠释区块链金融

CECBC

区块链技术 社会价值 打通数据孤岛 重建产业信用

为什么我们要自主开发一个稳定可靠的容器网络

BoCloud博云

云计算 容器 PaaS fabric

API网关——Kong实践分享

BoCloud博云

云计算 容器 PaaS API

【数据结构】Java 常用集合类 ConcurrentHashMap(JDK 1.8)

Alex🐒

Java 源码 数据结构 并发编程

Django Models随机获取指定数量数据方法

BigYoung

django 数据 random 随机 Models

前浪出新招,996已过时,互联网员工都开始住公司了!(爆公司信息)

程序员生活志

加班 996 007 互联网公司

随着并发压力的增加,系统响应时间和吞吐量如何变化,为什么?

chenzt

原生Ingress灰度发布能力不够?我们是这么干的

BoCloud博云

云计算 容器 云原生 PaaS

创业使人成长系列 (4)- 常用账号申请

石云升

支付宝 微信商户 商标

Java如何调用Python(一)

wjchenge

程序设计理念-CentOs7实践Nginx-带来安装服务的通用法则

图南日晟

nginx 架构设计 环境安装

百度大脑OCR技术助力钢铁物流实现智能管理

百度大脑

人工智能 百度大脑 文字识别

BIGO海量小文件存储实践

InfoQ_3597a20b53cc

【数据结构】Java 常用集合类 HashMap(JDK 1.8)

Alex🐒

Java 源码 数据结构

web压力性能测试

周冬辉

压力测试

PV与UV你的网站也可以

北漂码农有话说

Kubernetes的拐点助推器:左手开源,右手边缘计算

华为云开发者联盟

Kubernetes 容器 边缘计算 华为云

漫画:如何证明sleep不释放锁,而wait释放锁?

王磊

Java Wait Sleep

关于数据库索引的知识点,你所需要了解的都在这儿了

鄙人薛某

MySQL 索引结构 索引 MySQL优化

进击的 Flink:网易云音乐实时数仓建设实践

Apache Flink

flink

超详细讲解网络中的数据链路层~

程序员的时光

第7周总结:性能

慵秋

为啥Underlay才是容器网络的最佳落地选择

BoCloud博云

云计算 容器

Netty-物联网设备Channel管理

凸出

Java Netty ConcurrentHashMap 物联网 channel

创新监管首批8个试点应用公示 其中7个涉及区块链

CECBC

Google发布MultiModel:能够学习不同领域多任务的神经网络_Google_Roland Meertens_InfoQ精选文章