微软的汉英机器翻译达到人类水平_AI&大模型_Roland Meertens_InfoQ精选文章

AICon 上海站｜90%日程已就绪，解锁Al未来！了解详情 



 写点什么

登录/注册

看新闻很累？看技术新闻更累？试试下载 InfoQ 手机客户端，每天上下班路上听新闻，有趣还有料！

微软设计了一个翻译算法，把中文句子翻译成英文，其译文达到了人工翻译的水平。

长久以来，把中文句子翻译成英文一直是个难题。有些语言和英语的相似度很高，翻译起来比较容易。由于中文的句子结构不同，所以，对于许多传统的翻译算法来说，中文翻译都是一项挑战。借助在过去几年里屡创佳绩的神经机器翻译技术，微软让机器翻译出的句子可以媲美人类翻译出的句子。

微软研究人员在神经机器翻译中使用了两种现有的方法：对偶学习和推敲网络。借助对偶学习，系统从中文翻译生成的英文译文会被重新翻译成中文，从而保证结果的意思相同。在人工翻译过程中，为了验证翻译结果的正确性，人类也是这样做的，而机器似乎也得益于这一项技术。推敲网络是一种对生成的句子进行修改的方法。这项技术也是受人类的工作方式所启发：在翻译句子的时候，我们不是立即写下完整的翻译，而是修改再修改，找出最好的一个。

为了改进翻译算法，微软还开发了两项新技术。他们的联合训练技术会把英文句子翻译成中文，然后再译回英文，扩展训练集。两个翻译系统都使用这项技术进行了改进。他们还创建了“一致性原则（agreement regularization）”：他们让两个算法从右向左读取中文句子，然后再从左向右。如果两个算法都给出了相同的翻译，那么这就被视为翻译正确的有力证明。

需要注意，他们达到“媲美人类的里程碑”这一结论是通过双语顾问对比机器翻译和“黄金翻译”得出的。语言翻译评价会对比机器生成的结果和人工翻译给出的单个句子。这种方法的缺点是，没有完美的算法可以比较翻译结果的内在意义，从而确保他们的意思一致。这是所有翻译研究人员都面临的问题，包括谷歌在内，他们选用的算法在算法评价上效果较差，但在人类对比评估方面效果更好。

过去几年来，借助强大的神经网络，机器翻译社区在翻译算法方面取得了大量的成果。谷歌、 Facebook 和微软都争相开发最好的算法。微软在这里对比了传统翻译算法和神经翻译算法，但还没有把他们可以媲美人类的系统放在里面。

查看英文原文： Microsoft Achieved Human Parity on Chinese-English Machine Translation

评论

发布

暂无评论

AB Micro850笔记 LD 比较大于小于高低限值最大最小

万里无云万里天

自动化 PLC 工厂运维

AB Micro850笔记 LD 反向接触与反向线圈

万里无云万里天

自动化 PLC 工厂运维

AB Micro850笔记 LD 加减乘除取整取反取余绝对值

万里无云万里天

自动化 PLC 工厂运维

AB Micro850笔记 LD 直接接触与直接线圈

万里无云万里天

自动化 PLC 工厂运维

AB Micro850笔记 RSLinx 通信配置

万里无云万里天

自动化 PLC 工厂运维

AB Micro850笔记 LD 逻辑运算与或非异或

万里无云万里天

自动化 PLC 工厂运维

AB Micro850笔记 LD 指令块选择器与替换指令

万里无云万里天

自动化 PLC 工厂运维

AB Micro850笔记 LD 字符串处理

万里无云万里天

自动化 PLC 工厂运维

大模型RAG：文档分块方案与RAG全流程

程序员架构进阶

大模型 10月月更 rag 大模型应用

AB Micro850笔记 ccw 交叉引用浏览器

万里无云万里天

自动化 PLC 工厂运维

AB Micro850笔记 ccw 未使用的变量浏览器

万里无云万里天

自动化 PLC 工厂运维

AB Micro850笔记 ccw 变量导出功能

万里无云万里天

自动化 PLC 工厂运维

AB Micro850笔记 LD 计时器 ton tof

万里无云万里天

自动化 PLC 工厂运维

AB Micro850笔记 LD 计数器 ctd ctu

万里无云万里天

自动化 PLC 工厂运维

AB Micro850笔记 LD 结构化数据

万里无云万里天

自动化 PLC 工厂运维

AB Micro850笔记 LD 用户自定义功能块

万里无云万里天

自动化 PLC 工厂运维

AB Micro850笔记 LD 设置线圈与重设线圈

万里无云万里天

自动化 PLC 工厂运维

AB Micro850笔记 ccw 文档生成器

万里无云万里天

自动化 PLC 工厂运维