QCon北京「鸿蒙专场」火热来袭!即刻报名,与创新同行~ 了解详情
写点什么

Google 发布 MultiModel:能够学习不同领域多任务的神经网络

  • 2017-07-19
  • 本文字数:829 字

    阅读完需:约 3 分钟

Google 开发了一种可以接受多种形式输入并能生成多种形式输出的算法。

目前,大部分机器学习应用程序都只能关注一个领域。机器翻译一次只能建立一个语言对的模型,而图像识别算法一次只执行一个任务(例如描述图像、判断图像所属类别或在图像中查找对象)。然而,我们的大脑在执行所有任务时都能表现得很好,并且能够将知识从一个领域转移到另一个领域。大脑甚至可以将通过听学到的知识转换成其他领域的知识:看到或者读到的知识。

Google 开发了一个能够执行8 个不同领域任务的模型:语音识别、图像分类和添加标题、句法解析、英德互译和英法互译。这个模型由编码器、解码器和“输入输出混频器”组成,其中“输入输出混频器”会将先前的输入和输出馈送到解码器。如下图所示,每个“花瓣”表示一种形式(声音、文本或图像)。神经网络可以通过任意一种输入和输出的形式来学习每个任务。

2016 年 11 月,Google 发布了 zero-shot 翻译。该算法将所有句子映射到“中间语言”,“中间语言”指的是一种对于每种输入语言和输出语言都相同的句子。Google 只针对英韩语言对和英日语言对进行了训练,也就是说这个神经网络并未学习过对应的日韩语言对,但这时这个神经网络就能够进行日韩互译了。

Google 报告称,使用 MultiModel 时使用少量训练数据的任务表现更好。机器学习模型通常在使用更多训练数据的时候表现更好。使用 MultiModel 可以从多个领域获取额外的数据。需要注意的是,使用这种方法并没有打破标准任务任何已有的记录。

MultiModel 作为 Tensor2Tensor 库的一部分在 GitHub 开源。有关这个模型更详细的方法和研究结果可以在 arxiv.com 的论文 One Model To Learn Them All 中找到。

查看英文原文: Google Presents MultiModel: A Neural Network Capable of Learning Multiple Tasks in Multiple Domains


感谢冬雨对本文的审校。

给InfoQ 中文站投稿或者参与内容翻译工作,请邮件至 editors@cn.infoq.com 。也欢迎大家通过新浪微博( @InfoQ @丁晓昀),微信(微信号: InfoQChina )关注我们。

2017-07-19 19:001811
用户头像
蔡芳芳 InfoQ主编

发布了 804 篇内容, 共 574.6 次阅读, 收获喜欢 2799 次。

关注

评论

发布
暂无评论
发现更多内容

影视解说类自媒体如何才能求同存异

石头IT视角

AdapterPattern-适配器模式

梁歪歪 ♚

设计模式

# 继续前行github star突破8k即时通讯IM开源项目OpenIM版本发布计划

Geek_1ef48b

FacadePattern-门面模式

梁歪歪 ♚

设计模式

electron打包vue cli项目的配置问题

空城机

Electron 5月月更

如何提高技术部的信任值

石云升

项目管理 职场经验 5月月更 跨部门沟通

微信朋友圈高性能复杂度分析

Justin1024

在操作系统这条赛道上,为什么Laxcus和Windows、MacOS不一样

LAXCUS分布式操作系统

大数据 容器 虚拟化 并行计算 分布式操作系统

[Day48]-[递归]-基本计算器 II

方勇(gopher)

递归 LeetCode

密码学系列之:PEM和PKCS7,PKCS8,PKCS12

程序那些事

密码学 程序那些事 5月月更

海洋元宇宙AQUANEE最新进展一览

股市老人

如何系统学习机器学习?

宇宙之一粟

机器学习 5月月更

微信朋友圈的高性能复杂度架构

Pengfei

【Go实现】实践GoF的23种设计模式:抽象工厂模式

元闰子

Go 设计模式 抽象工厂模式

架构实战营 - 模块 2 作业

Gavin.Yang

分析朋友圈的高性能复杂度

小马

#架构实战营

【LeetCode】判断一个数的数字计数是否等于数位的值Java题解

Albert

LeetCode 5月月更

leetcode 540. Single Element in a Sorted Array 有序数组中的单一元素

okokabcd

LeetCode 查找

Apipost——中文版的Postman?

Xd

API 接口测试工具

CPU性能测试工具

穿过生命散发芬芳

5月月更 CPU性能测试

架构实战营 模块二作业(微信朋友圈高性能复杂度分析)

Gor

ProxyPattern-代理模式

梁歪歪 ♚

设计模式

SDN系统方法 | 1. 概述

俞凡

架构 网络 sdn SDN系统方法

SpringCloud Alibaba Sentinel 限流详解

牧小农

sentinel springcloudAlibaba

架构实战营模块 2 作业

Naoki

架构实战营

一文读懂AQUANEE的开创性特点与未来

西柚子

软件构建

GalaxyCreater

架构 敏捷 软件设计

从发电到深空探索:微藻带来的可持续未来

脑极体

DecoratorPattern-装饰者模式

梁歪歪 ♚

设计模式

一文读懂AQUANEE的开创性特点与未来

小哈区块

6点下班不是梦,Apipost帮您轻松完成接口测试及接口文档

Xd

接口测试 apipost

Google发布MultiModel:能够学习不同领域多任务的神经网络_Google_Roland Meertens_InfoQ精选文章