谷歌NLP新进展:利用AI改变句子的情绪、时态

2018 年 12 月 06 日

谷歌NLP新进展:利用AI改变句子的情绪、时态

在蒙特利尔的 NeurIPS 2018 会议上,来自密歇根大学和谷歌大脑的论文:《Content preserving text generation with attribute controls》(内容保留文本生成与属性控制),提出了一种新的机器学习架构,该架构可以从给定样本生成句子,并且在不改变句子原意的基础上增加表达情绪的文字,甚至可以添加拟声词。


据介绍,这一技术未来可以用在转述、机器翻译、会议记录等系统中,同时该技术还进一步补充了 11 月份微软所展示的利用 NLP 技术对弱结构化文本中的关系进行处理的系统。


阅读详细论文可以从以下入口进入:


密歇根大学与谷歌大脑《内容保留文本生成与属性控制》:

https://papers.nips.cc/paper/7757-content-preserving-text-generation-with-attribute-controls.pdf


微软研究院《结构化神经概述》:

https://arxiv.org/pdf/1811.01824.pdf


研究人员在论文中写道:


我们解决了修改句子文本属性的问题,据我们了解,我们演示的是第一个在没有并行数据的情况下学习并修改给定句子多个文本属性的实例。



文本示例:尝试改变句子的情绪


研究团队首先解决了情绪控制的问题。他们从一个餐馆评论数据集(Yelp 评论数据集的过滤版本)和一个 IMDB 电影评论的大集合中分别获取了 44.7 万句和 30 万句的评论,并利用这些评论来训练系统。


在训练结束后,研究人员利用一个包含 12.8 万个餐馆评论和 3.6 万个电影评论的测试数据集,试图基于带有负面情绪的句子生成带有正面情绪的文本片段,反之亦然。


之后,研究人员在 BLEU(“双语评估替补”的缩写)上进行评估,人工智能系统能够超越两种领先的文本生成方法。BLEU 是评估机器翻译文本的度量标准。此外,它始终能生成与输入句子相关的语法正确的句子——以至于亚马逊的 Mechanical Turk 上的研究参与者认为它的输出比以前的方法更现实。


研究人员表示,生成的句子出人意料地连贯。例如,“柜台后面的人一点也不友好”变成了“柜台后面的人非常友好,乐于助人”(上图示例中的第一个案例)。在另一个例子中,这个模型反过来说,“这是这部电影的另一个有趣的方面”,“这部电影没有可取之处”(上图示例中第三个案例)。


更令人印象深刻的是,在另一项测试中,研究人员使用该系统同时控制句子的多个属性——包括情绪、时态、声音等。在对来自多伦多图书语料库的 200 万段文本片段数据集进行训练后,该模型能够将句子从指示性语气:“John will not survive in the camp”翻译成条件时态的虚拟语气:“John couldn 't live in the camp”。



文本示例:改变句子的多个属性


研究人员表示:“我们已经证明,我们的模型通过各种实验和指标有效地反映了条件信息,虽然之前的工作集中在控制单个属性和改变句子情绪,但是我们所提出的模型很容易扩展到多个属性场景。在这个框架中考虑具有连续值的属性,以及更大的语义和语法属性集将是未来一项有趣的工作。”


原文链接:


https://venturebeat.com/2018/12/05/googles-ai-can-change-the-mood-voice-tense-and-sentiment-of-sentences/


2018 年 12 月 06 日 18:05963
用户头像
陈思 InfoQ编辑

发布了 555 篇内容, 共 189.7 次阅读, 收获喜欢 1064 次。

关注

评论 1 条评论

发布
暂无评论
发现更多内容

训练营第二周总结

Mr冰凉

架构师训练营 - 第二周作业

Melo

架构师训练营」第 2 周作业

edd

架构 极客大学架构师训练营

「架构师训练营」第 2周作业

旭东(Frank)

架构 极客大学架构师训练营

听说你 ping 用的很 6 ?给我图解一下 ping 的工作原理

小林coding

面试 计算机网络 计算机基础

Libra教程之:运行自定义move modules

程序那些事

比特币 区块链 以太坊 libra blockchain

第二周总结

changtai

第二周作业

大雄

依赖倒置

为什么 Vue 更符合这个时代的大势所趋

Geek_Willie

Vue SpreadJS

T4P

xujiangniao

[Redis源码阅读]redis持久化

老胡爱分享

数据库 redis 缓存 持久化

学习一下:我的学习之道

非著名程序员

学习 程序人生 提升认知 程序员成长

Redis系列之扫盲篇(一)

z小赵

Java 分布式 高并发系统设计

BAT面试题汇总:分布式+Dubbo +JVM+微服务+多线程+Spring附答案(建议收藏)

程序员生活志

Java spring 面试 分布式 mybatis

架构师训练营第二周总结:软件开发简史和框架设计的方法

hifly

设计模式 极客大学架构师训练营

Libra教程之:Libra testnet使用指南

程序那些事

比特币 区块链 以太坊 libra blockchain

基于 Docker 实现 MySQL 主从复制

ytao

MySQL Dockerfile

【架构师训练营】第2周总结

花生无翼

极客大学架构师训练营

架构师训练营-第二周-作业1

狂奔嘀兔纸

极客大学架构师训练营

如何高效开会?

石云升

高效工作 时间管理 高效 开会

2020年6月17日 MySQL基准测试

瑞克与莫迪

小师妹学JVM之:深入理解JIT和编译优化-你看不懂系列

程序那些事

Java JVM 「Java 25周年」 小师妹 JIT

一款开源的Diffy自动化对比测试框架:超详细实战讲解

狂师

测试 测试驱动开发实战营 自动化测试 开源项目

架构师训练营 第二周 总结

Poplar

架构师训练营作业 --Week2

吴炳华

极客大学架构师训练营

极客大学架构师训练营--编程的未来 面向对象 依赖倒置原则 -- 第二次作业

John(易筋)

极客时间 极客大学 架构师 极客大学架构师训练营 依赖倒置原则

Libra教程之:来了,你最爱的Move语言

程序那些事

比特币 区块链 以太坊 libra blockchain

重学 Java 设计模式:实战代理模式「模拟mybatis-spring中定义DAO接口,使用代理类方式操作数据库原理实现场景」

小傅哥

设计模式 小傅哥 重构 代码优化

程序员开发色情游戏,赴日寻找AV女优真人拍摄,结果...

程序员生活志

程序员 游戏开发

0616作业2

Geek_10

依赖倒置原则理解

Thrine

谷歌NLP新进展:利用AI改变句子的情绪、时态-InfoQ