写点什么

微软的汉英机器翻译达到人类水平

  • 2018-03-21
  • 本文字数:896 字

    阅读完需:约 3 分钟

看新闻很累?看技术新闻更累?试试下载 InfoQ 手机客户端,每天上下班路上听新闻,有趣还有料!

微软设计了一个翻译算法,把中文句子翻译成英文,其译文达到了人工翻译的水平

长久以来,把中文句子翻译成英文一直是个难题。有些语言和英语的相似度很高,翻译起来比较容易。由于中文的句子结构不同,所以,对于许多传统的翻译算法来说,中文翻译都是一项挑战。借助在过去几年里屡创佳绩的神经机器翻译技术,微软让机器翻译出的句子可以媲美人类翻译出的句子。

微软研究人员在神经机器翻译中使用了两种现有的方法:对偶学习推敲网络。借助对偶学习,系统从中文翻译生成的英文译文会被重新翻译成中文,从而保证结果的意思相同。在人工翻译过程中,为了验证翻译结果的正确性,人类也是这样做的,而机器似乎也得益于这一项技术。推敲网络是一种对生成的句子进行修改的方法。这项技术也是受人类的工作方式所启发:在翻译句子的时候,我们不是立即写下完整的翻译,而是修改再修改,找出最好的一个。

为了改进翻译算法,微软还开发了两项新技术。他们的联合训练技术会把英文句子翻译成中文,然后再译回英文,扩展训练集。两个翻译系统都使用这项技术进行了改进。他们还创建了“一致性原则(agreement regularization)”:他们让两个算法从右向左读取中文句子,然后再从左向右。如果两个算法都给出了相同的翻译,那么这就被视为翻译正确的有力证明。

需要注意,他们达到“媲美人类的里程碑”这一结论是通过双语顾问对比机器翻译和“黄金翻译”得出的。语言翻译评价会对比机器生成的结果和人工翻译给出的单个句子。这种方法的缺点是,没有完美的算法可以比较翻译结果的内在意义,从而确保他们的意思一致。这是所有翻译研究人员都面临的问题,包括谷歌在内,他们选用的算法在算法评价上效果较差,但在人类对比评估方面效果更好。

过去几年来,借助强大的神经网络,机器翻译社区在翻译算法方面取得了大量的成果。谷歌 Facebook 和微软都争相开发最好的算法。微软在这里对比了传统翻译算法和神经翻译算法,但还没有把他们可以媲美人类的系统放在里面。

查看英文原文 Microsoft Achieved Human Parity on Chinese-English Machine Translation

2018-03-21 19:002540
用户头像

发布了 1008 篇内容, 共 392.8 次阅读, 收获喜欢 344 次。

关注

评论

发布
暂无评论
发现更多内容

git stash误使用drop删掉本地保存,恢复代码一次记录

良知犹存

git

运动居然成了我的奢侈品?

悟空聊架构

程序员 程序人生 运动 6月日更

设计微博系统中”微博评论“的高性能高可用计算架构

贯通

#架构实战营

架构实战营5 作业

梦寻解语花

架构实战营

模块五:课后作业

黄先生

模块5 学习总结

TH

架构实战营

前端vue在可视化大屏领域的工作实践

孙叫兽

Vue 可视化 eCharts 可视化地图 引航计划

”微博评论“的高性能高可用计算架构

thewangzl

模块5-”微博评论“的高性能高可用计算架构

小遵

架构实战营模块5

阿体

react源码解析7.Fiber架构

全栈潇晨

react.js react源码

如何画好架构图 (建议收藏)

悟空聊架构

流程图 架构图 6月日更 processon 原理图

新手模拟实现call和apply

前端树洞

大前端 js this JavaScrip

spring-beans 注册 Beans(三) ConfigurationClassPostProcessor处理BeanDefinition流程

梦倚栏杆

模块五 作业

薛定谔的指南针

架构实战营

架构实战营模块五作业

冷大大

作业 架构实战营 模块五

【LeetCode】目标和Java题解

Albert

算法 LeetCode 6月日更

架构模块5作业

高亮

架构训练营

JVM之内存管理

邱学喆

JVM 内存管理 垃圾回收算法 垃圾回收器

架构实战营 模块五作业

Dylan

架构实战营

【Flutter 专题】110 页面间小跳转 (四)

阿策小和尚

Flutter 小菜 0 基础学习 Flutter Android 小菜鸟 6月日更

作业

CR

从水晶宫到甲秀楼:在数博会读懂智慧城市的“大工业时代”

脑极体

架构实战营 模块五课后作业

iProcess

架构实战营

模块5作业 微博评论高性能高可用计算架构

TH

架构实战营

模块五-微博评论高性能高可用计算架构

华仔架构训练营

架构训练营——模块五作业——微博评论

开拓纪

架构训练营 模块五 微博评论

用Docker的方式编译OpenVINO

IT蜗壳-Tango

6月日更

【Vue2.x 源码学习】第六篇 - 数据代理的实现

Brave

源码 vue2 6月日更

Proxy 对象简介

编程三昧

JavaScript 大前端 ES6 Proxy

模块5作业

大肚皮狒狒

微软的汉英机器翻译达到人类水平_AI&大模型_Roland Meertens_InfoQ精选文章