写点什么

Facebook 公布最新的神经网络机器翻译算法

  • 2017-05-25
  • 本文字数:838 字

    阅读完需:约 3 分钟

Facebook 的人工智能研究团队公布了他们最新的神经网络机器翻译(NMT)研究成果。同时进行三个机器翻译任务,他们的算法比其他任何一个系统的得分都要高,而且比Google 的NMT 系统快上9 倍。

Facebook 使用了卷积神经网络,该技术在计算机视觉领域得到广泛应用。它以一种结构化的顺序来处理句子,捕捉句子成分之间复杂的关系。Facebook 对计算机进行训练,让它们能够识别出句子(由两个、三个、四个或更多的单词组成)各个部分的含义。通过使用神经网络来处理句子,计算机可以理解句子各个部分的含义。然后使用另一种神经网络将这些意思转译成另外一门语言。

卷积的主要优势在于,你可以同时将其应用在句子的多个成分上。传统的NMT 技术逐字地读取句子,然后记下句子在当前位置的意思。计算机的速度限制了串行化读取的速度,结果就是Facebook 的算法可以比串行化读取技术最多快上9 倍。

他们还引入一种新的技术,叫作“multi-hop”。这种技术并不是整句地读取然后整句地翻译,而是进行逐字翻译。multi-hop 是一种新技术,比“专注”(attention)机制更智能、更复杂。专注机制是解决多义词问题的关键。一个单词在不同的上下文里具有不同的含义。在翻译一个单词的时候,专注机制根据原文的相关部分为单词选择最合适的释义,从而解决多义词问题。

Facebook 打算将他们的新技术应用在其他文字处理任务上,比如使用神经网络来回答问题。新技术可以让他们同时专注于对话的每一个部分。他们在博客上完整地介绍了他们的新技术,还有一份可以自由访问的论文。如果有人想尝试他们的算法,可以从 GitHub 下载代码。

在进行英语到法语、英语到德语和英语到罗马尼亚语的翻译时,新算法比其他任何一个算法都要快。它打败了 Google 的神经网络机器翻译技术。 Google Translate SDK 提供了 Google 的翻译算法,可以支持 20 种语言互译组合。如果有人想知道 NMT 和传统技术之间的区别,可以试着使用 Microsoft Translator 来翻译他们喜欢的内容。

查看英文原文: Facebook Publishes New Neural Machine Translation Algorithm

2017-05-25 19:003284
用户头像

发布了 322 篇内容, 共 142.7 次阅读, 收获喜欢 147 次。

关注

评论

发布
暂无评论
发现更多内容

BS-GX-018 基于SSM实现在校学生考试系统,linux系统架构和应用技巧pdf

Java 程序员 后端

disruptor笔记之二:Disruptor类分析,java的学习网站

Java 程序员 后端

disruptor笔记之四:事件消费知识点小结,kalilinux教程pdf

Java 程序员 后端

【Java 原理剖析系列】深度分析 Semaphore工作原理分析

洛神灬殇

Java 并发编程 Semaphore 11月日更

APP性能优化系列-自定义启动器(三),阿里巴巴java面试几轮

Java 程序员 后端

BATJ互联网公司必问知识点:Spring十个面试专题及答案(1)

Java 程序员 后端

CentOS7环境部署kubenetes1,数据库mysql面试题

Java 程序员 后端

Ceph实战(三)-块设备的创建与映射,netty架构原理图

Java 程序员 后端

Choreographer机制和卡顿优化,mysql基础入门

Java 程序员 后端

一文了解 PG PITR 即时恢复

青云技术社区

数据库 postgresql 云计算

在线文本去空行工具

入门小站

工具

BATJ互联网月薪45K的Java岗面试题首次曝光,掌握这些Offer指定跑不了

Java 程序员 后端

BATJ互联网公司面试必问知识点:Spring全家桶全解,java分布式框架技术方案

Java 程序员 后端

BAT面试必考Java面试题100+:Kafka,mysql连接查询原理

Java 程序员 后端

CompletableFuture异步编程,高级java开发笔试题

Java 程序员 后端

详解低延时高音质:编解码篇

声网

编解码 音频体验 Opus

Class文件结构介绍[字段表集合和方法表集合],kafka基础原理

Java 程序员 后端

ConcurrentHashMap扩容?lastRun到底是个啥?,理解透彻

Java 程序员 后端

Go语言,协程的深入剖析

微客鸟窝

Go 语言 11月日更

B站,牛逼!,字节跳动算法工程师面试总

Java 程序员 后端

CAS之ABA问题的解决方法,深入理解Nginx及使用Nginx实现负载均衡

Java 程序员 后端

BS-GX-016基于SSM实现教材管理系统,unixlinux编程实践教程

Java 程序员 后端

CentOS8安装Docker,经典实战教程

Java 程序员 后端

CentOS安装Redis,java程序员进阶路线

Java 程序员 后端

Docker Swarm从部署到基本操作,Java程序员进大厂面试必备基础技能

Java 程序员 后端

Chrome上的这些灵魂插件太猛了,碾压其他同款,美团二面惜败

Java 程序员 后端

C语言AES算法实现(基于Mbedtls),java中高级面试题最新

Java 程序员 后端

DL4J实战之一:准备,工业互联网架构师

Java 程序员 后端

BATJ互联网公司必问知识点:Spring十个面试专题及答案,java技术面试总结评语

Java 程序员 后端

CentOS中VMware tools的安装以及安装失败的解决办法,java程序设计教程pdf

Java 程序员 后端

案例推荐|Apache Pulsar 助力金山云日志服务,日处理 200TB 数据

Apache Pulsar

开源 云原生 日志 中间件 Apache Pulsar 消息系统

Facebook公布最新的神经网络机器翻译算法_Meta_Roland Meertens_InfoQ精选文章