【AICon】 如何构建高效的 RAG 系统?RAG 技术在实际应用中遇到的挑战及应对策略?>>> 了解详情
写点什么

谷歌搜索引入多任务统一模型 MUM,可更准确理解信息 | Google I/O 2021

  • 2021-05-20
  • 本文字数:1537 字

    阅读完需:约 5 分钟

谷歌搜索引入多任务统一模型MUM,可更准确理解信息 | Google I/O 2021

美国时间 5 月 18 日,Google I/O 2021开发者大会正式开幕。去年,该会议因疫情取消,今年重新恢复并采用全程线上的形式,对所有开发者免费开放。在刚刚结束的主题演讲中,谷歌发布了 TPU V4 人工智能芯片、自然语言平台 LaMDA 以及一系列原有产品的更新升级。本文,我们将详细介绍谷歌搜索引入的多任务统一模型 MUM。


每天都有很多人使用谷歌来处理需要多步骤的各种任务,而人们在处理类似的复杂任务时平均会发出 8 个查询。如今,搜索引擎还没有成熟到可以像专家一样回答问题。但随着“多任务统一模型”(Multitask Unified Model,MUM)的出现,谷歌正在帮助解决这类复杂需求。因此,未来只需要较少的搜索就可以完成任务。

 

BERT 一样,MUM 同样基于 Transformer 架构,但是它的功能要强大 1000 倍。MUM 不仅可以理解语言,而且可以生成语言。MUM 同时用 75 种不同的语言进行了多项任务的训练,使其比以前的模型更全面地理解信息和世界知识。此外,MUM 是多模态的,因此它能够理解文本和图像中的信息,将来,还可以扩展到视频和音频等更多模态。

 

以徒步富士山的问题为例:MUM 可以理解你在比较两座山,因此海拔高度和路径信息可能是相关的。它还可以理解,就远足而言,“准备工作”可能包括诸如健身训练以及寻找合适的装备。


因为 MUM 能够基于其对这个世界的深刻理解来展现自己的见解,所以它可以强调,尽管两座山的海拔高度大致相同,但秋季是富士山的雨季,你可能需要一件防水夹克。MUM 也能为更深层次的探索提供有用的副主题:比如顶级装备或最佳训练练习,并提供一些网络上有用的文章、视频和图片的链接。


消除语言障碍

 

在获取信息时,语言可能是一个重要障碍。通过不同语言的知识迁移,MUM 有可能打破这些界限。它可以从那些不是用你的搜索语言写成的资料中学习,并且能帮助把这些相关信息发给你。

 

假设有一些关于富士山真正有用的信息是用日语写的;现在,如果你不用日语搜索,你很可能无法找到这些信息。然而,MUM 可以从不同语言的来源中迁移知识,并利用这些洞察力发现与你的首选语言最相关的结果。所以,在将来,当你搜索有关远足富士山的信息时,你可能会看到这样的结果:在何处能欣赏到富士山最美的风景、当地的温泉,以及受欢迎的纪念品商店……这些信息很容易用日语搜索就能找到。

 


理解不同类型的信息

 

多模态的 MUM 意味着它能够同时理解来自不同格式的信息,比如网页、图片等等。最终,你可能会拍一张登山靴的照片,然后问:“我能用它去爬富士山吗?”MUM 将会理解这张图片,并把它和你的问题联系在一起,让你知道你的靴子会很好用。之后,它会给你发一个博客网址,上面有推荐的装备列表。


带着负责的态度把高级人工智能运用到搜索中

 

无论何时,当我们使用人工智能来使世界上的信息更容易获取时,我们都要负责任地这样做。对于谷歌搜索的每一项改进,我们都会进行严格的评估,以确保我们能提供更加相关和有用的结果。那些遵循我们《搜索质量评分准则》(Search Quality Rater Guidelines)的人类评分者,帮助我们了解我们的结果如何帮助人们找到信息。

 

就像我们已经仔细测试了 BERT 从 2019 年开始推出的许多应用一样, MUM 也会经历同样的过程,将这些模型应用于搜索。具体地说,为了避免在我们的系统中引入偏见,我们将寻找可能显示机器学习中偏见的模式。同时,我们也会运用最新的研究成果,比如如何减少 MUM 等训练系统的碳足迹,以确保搜寻工作尽可能高效。

 

今后数月甚至数年,我们将把 MUM 驱动的功能和改进带到我们的产品中。虽然我们仍处在 MUM 探索的初期,但这是一个重要的里程碑,将来谷歌能够理解人们自然地交流和解释信息的各种方式。

 

作者介绍:

 

Pandu Nayak,谷歌研究员兼搜索部门副总裁。

 

原文链接:

 

https://blog.google/products/search/introducing-mum/

2021-05-20 10:442771

评论

发布
暂无评论
发现更多内容

追踪 Kubernetes 中的数据包

张晓辉

Kubernetes 网络

Dubbo + ZooKeeper|如何解决线上故障排查链路长的难题

云布道师

dubbo

人工智能与软件工程

紫晖

人工智能 机器学习 软件工程 工程

如何实现云数据治理中的数据安全?

京东科技开发者

云计算 大数据 数据治理 企业号 3 月 PK 榜 计算资源

在京东如何做好前端系统的可观测性

京东科技开发者

前端 京东云 京东技术

gt-checksum 1.2.1发布,新增表结构校验及修复等超实用特性

GreatSQL

MySQL greatsql社区 gt-check

一文吃透扫码登录原理

程序员大彬

Java java面试 扫码

Three.js 进阶之旅:物理效果-3D乒乓球小游戏 🏓

dragonir

CSS JavaScript 前端 React three.js

移动云发布操作系统迁移工具,助力全场景业务一站式迁移

openEuler

Linux centos 操作系统 虚拟化 openEuler

运维训练营第19周作业

好吃不贵

利用 ChangeStream 实现 Amazon DocumentDB 表级别容灾复制

亚马逊云科技 (Amazon Web Services)

美团:某动态线程池框架是官方开源的么?

马丁玩编程

线程池 美团线程池

AAA级认证!索信达综合信用水平获高度认可

索信达控股

手把手带你上手ChatGPT

老周聊架构

3月月更 ChatGPT

作为移动开发你不能不了解的编译流程

京东科技开发者

编译器 移动开发 京东云 京东技术

Tars-Java网络编程源码分析

vivo互联网技术

网络编程 nio TARS

Parallels Desktop虚拟机问题汇总

魔仙苹果mac堡

常见问题 parallels desktop18 pd虚拟机 PD密钥

Final Cut Pro资源库占用内存太大如何释放磁盘空间?

魔仙苹果mac堡

FCPX下载 fcpx Final Cut Pro空间不足 fcpx中文版

什么是容器编排及编排的优点

黎博

容器编排 Kubernetes Serverless

PyTorch深度学习实战 | 神经网络的优化难题

TiAmo

PyTorch 随机梯度下降 动态调整

基于 Kafka 和 Elasticsearch 构建实时站内搜索功能的实践

京东科技开发者

MySQL ES 京东云 京东物流 京东技术

稳定高效数据库管理:Valentina Studio Pro激活版

真大的脸盆

数据库 Mac 数据库管理工具 Mac 软件 管理数据库

解决苹果无线鼠标、键盘或触控板无法被 Mac 识别的方法

魔仙苹果mac堡

mac系统 苹果无线鼠标 触控板 无法被mac识别

常用对话框基本使用

攻城狮Wayne

dialog timepicker progress

如何实现云数据治理中的数据安全?

京东科技开发者

数据库 云计算 京东云 京东技术

聊一聊系统重构

线段树模板与练习

timerring

线段树

简历上的项目,需要这样描述才有亮点!

小傅哥

Java 面试 项目 简历 校招

使用K8S进行蓝绿部署的简明实操指南

SEAL安全

k8s 企业号 3 月 PK 榜 蓝绿部署

实现常驻任务除了避免昙花线程,还需要避免重返线程池

newbe36524

C#

交易履约之产品中心实践

京东科技开发者

交易 京东云 京东技术 京东科技 产品中心

谷歌搜索引入多任务统一模型MUM,可更准确理解信息 | Google I/O 2021_AI&大模型_谷歌官方博客_InfoQ精选文章