Google发布MultiModel：能够学习不同领域多任务的神经网络_Google_Roland Meertens_InfoQ精选文章

Google 开发了一种可以接受多种形式输入并能生成多种形式输出的算法。

目前，大部分机器学习应用程序都只能关注一个领域。机器翻译一次只能建立一个语言对的模型，而图像识别算法一次只执行一个任务（例如描述图像、判断图像所属类别或在图像中查找对象）。然而，我们的大脑在执行所有任务时都能表现得很好，并且能够将知识从一个领域转移到另一个领域。大脑甚至可以将通过听学到的知识转换成其他领域的知识：看到或者读到的知识。

Google 开发了一个能够执行8 个不同领域任务的模型：语音识别、图像分类和添加标题、句法解析、英德互译和英法互译。这个模型由编码器、解码器和“输入输出混频器”组成，其中“输入输出混频器”会将先前的输入和输出馈送到解码器。如下图所示，每个“花瓣”表示一种形式（声音、文本或图像）。神经网络可以通过任意一种输入和输出的形式来学习每个任务。

2016 年 11 月，Google 发布了 zero-shot 翻译。该算法将所有句子映射到“中间语言”，“中间语言”指的是一种对于每种输入语言和输出语言都相同的句子。Google 只针对英韩语言对和英日语言对进行了训练，也就是说这个神经网络并未学习过对应的日韩语言对，但这时这个神经网络就能够进行日韩互译了。

Google 报告称，使用 MultiModel 时使用少量训练数据的任务表现更好。机器学习模型通常在使用更多训练数据的时候表现更好。使用 MultiModel 可以从多个领域获取额外的数据。需要注意的是，使用这种方法并没有打破标准任务任何已有的记录。

MultiModel 作为 Tensor2Tensor 库的一部分在 GitHub 开源。有关这个模型更详细的方法和研究结果可以在 arxiv.com 的论文 One Model To Learn Them All 中找到。

查看英文原文： Google Presents MultiModel: A Neural Network Capable of Learning Multiple Tasks in Multiple Domains

感谢冬雨对本文的审校。

给InfoQ 中文站投稿或者参与内容翻译工作，请邮件至 editors@cn.infoq.com 。也欢迎大家通过新浪微博（ @InfoQ ， @丁晓昀），微信（微信号： InfoQChina ）关注我们。

评论

发布

暂无评论

安装Android系统 missing operating system

QA为什么转换角色

软件测试 QA 职业发展

Java 程序经验小结：返回零长度的数组或集合，而不是null

后台技术汇

阿里巴巴2021年最新开源十亿级Java高并发系统设计手册

Java架构追梦

Java 阿里巴巴架构并发系统架构设计手册

WebRTC 的现状和未来：专访 W3C WebRTC Chair Bernard Aboba

阿里云CloudImagine

阿里云 WebRTC 视频云

阿里架构师经验分享！Android面试知识点总结宝典助你通关！顺利通过阿里Android岗面试

欢喜学安卓

android 程序员面试移动开发

怎么提升写代码的能力

阿里巴巴云原生

程序员个人成长方法论云原生自我思考

TarsBenchmark | 服务性能压测利器

微服务压力测试 TARS

热情空前，家长纷纷变身“寒假规划师”，如何抓住这波热潮？

AI 在线教育在线课堂

redis持久化怎么选？成年人从来不做选择...

我所认为的产品经理能力模型

2020中国ToB独角兽：估值逆势起飞，寡头效应加剧

ToB行业头条

《我想进大厂》之分布式事务篇

Java 面试后端

从根上理解高性能、高并发(五)：深入操作系统，理解高并发中的协程

网络编程高并发协程高性能即时通讯

案例集锦|科技赋能，华为云GaussDB助千行百业数字化转型

华为云开发者联盟

数据库华为云企业应用

架构师 3 期 3 班 -week8- 作业

【有奖调研】中国人工智能开发者调研

阿里架构师深入讲解Android开发！教你一种更清晰的Android架构！BAT大厂面试总结

欢喜学安卓

android 程序员面试移动开发

盘点2020 | 百度AI的2020

惊喜来袭！253页全彩免费电子书《Python 编程参考》正式上线发布

Python redis 程序设计 Go 语言

使用Apollo升级一下yml文件管理和发布

Kubernetes安装篇（上）：基于Minikube方式部署本地环境

Kubernetes 安装 minikube 28天写作 Kubernetes从入门到精通

是找茬?还是装B？阿里面试每轮必问的“Spring Boot”意义何在？

Java 编程架构面试计算机

云原生 DevOps 的 5 步升级路径

阿里巴巴云原生

Serverless 容器 DevOps 微服务云原生

新年Flag 中奖名单公布｜如何科学的从55人中随机选出11个中奖名额

InfoQ写作社区官方

话题讨论热门活动

基于gRPC的注册发现与负载均衡的原理和实战

微服务 go-zero Go 语言

Soul网关源码阅读番外篇（一） HTTP参数请求错误

Java 源码阅读网关

dubbo-go 白话文 | 从零搭建 dubbogo 和 dubbo 的简单用例

阿里巴巴云原生

Java 云原生 dubbo 中间件 dubbogo

SpringCloud 从入门到精通 12---Nacos配置中心

COCO聊天挖矿系统开发|COCO聊天挖矿软件APP开发

iOS音视频--视频合集

程序员音视频 OpenGL ES GPUImage Metal