QCon 演讲火热征集中,快来分享技术实践与洞见! 了解详情
写点什么

文本表示与文本生成模型新进展与应用

  • 2019-09-17
  • 本文字数:797 字

    阅读完需:约 3 分钟

文本表示与文本生成模型新进展与应用

AICon北京2018大会上,李磊讲师做了《文本表示与文本生成模型新进展与应用》主题演讲,主要内容如下。


演讲简介


本次讲座将介绍文本表示和文本生成方面的近一年重要进展。文本表示和生成是两个不可分割的任务。今年包括 ELMo、GPT、BERT 等新工作通过上下文语境对词向量建模。而今年也有一系列工作寻找最优表达句子的树以及研究基于树结构表示句子中的决定性因素。利用更好的表示,我们改进了翻译模型中过翻译和欠翻译的问题。我们也将介绍利用监督和非监督的方法训练模型根据关键词生成句子,进而推广到一般受限文本生成。基于这些技术,我们研发的写稿机器人已经写作超过 6 万篇文章跨 6 个语言,拥有 12 万多粉丝关注。我们也将介绍文本生成在搜索和广告等场景中的应用。


演讲提纲:


  1. 写稿机器人概述

  2. 句子表示

  3. (1)上下文相关向量话表示 ELMo、GPT、BERT

  4. (2)树结构的神经网络句子表示

  5. 机器翻译中的词覆盖问题

  6. (1)词覆盖模型

  7. (2)Past-and-future 模型

  8. 受限文本生成

  9. (1)监督方法

  10. (2)非监督贝叶斯采样方法 CGMH

  11. (3)时间序列补全模型

  12. 应用介绍


听众收益:


  1. 了解机器写稿、文本生成和翻译的工业界应用

  2. 了解文本句子表示的最近一年新进展

  3. 了解文本生成中的监督和非监督方法


讲师介绍


李磊


字节跳动 人工智能实验室总监


李磊博士,字节跳动人工智能实验室总监,原百度美国深度学习实验室少帅科学家。上海交通大学计算机系本科,卡耐基梅隆大学计算机系博士,加州大学伯克利分校博士后研究员。曾获 2012 年美国计算机学会 SIGKDD 最佳博士论文之一、2017 年吴文俊人工智能技术发明二等奖。在机器学习、数据挖掘和自然语言理解领域于国际顶级学术会议发表论文 40 余篇,拥有三项美国技术发明专利,担任 CCF 中文信息处理专委委员,2017 KDD Cup 及 2018 KDD Hands-on Tutorial 联合主席, AAAI 2019 资深程序委员和 ICML、KDD、IJCAI 等大会程序委员。












完整演讲 PPT 下载链接


https://aicon.infoq.cn/2018/beijing/#schedule


2019-09-17 13:591432

评论

发布
暂无评论
发现更多内容

kubernetes node affinity 写法

Geek_f24c45

Kubernetes

cookie和session的关系看这一篇就够了

架构师修行之路

session Cookie

云算力挖矿平台APP,算力挖矿建设开发

13530558032

大数据应用场景

dongge

42图揭秘,「后端技术学些啥」

我是程序员小贱

Week 12 学习总结

Jeremy

第九周

Acker飏

AtlassianTeam Playbook | 用户体验中的移情地图

Atlassian

团队管理 敏捷开发 Atlassian

微服务架构下的系统集成

码猿外

架构 微服务 系统集成

FlinkX 如何读取和写入 Clickhouse?

Apache Flink

flink

2020-08-29-第十二周作业

路易斯李李李

2020-08-29-第十二周学习总结

路易斯李李李

听说,阿里云给它的 OpenAPI 开发了一套编程语言

郭旭东

阿里云 OpenAPI

架构师训练营第十二周作业

Hanson

【Spring Boot系列】之多种依赖集成方式

语霖

架构师训练营 -- 第 12 周作业

stardust20

你真的知道什么是线程安全吗?

老胡爱分享

并发编程 线程 java 并发

架构设计开学第一天

escray

学习 从零开始学架构 架构师预科班

甲方日常 5

句子

工作 随笔杂谈 日常

3种 Springboot 全局时间格式化方式,别再写重复代码了

程序员小富

Java springboot

Flink SQL FileSystem Connector 分区提交与自定义小文件合并策略

Apache Flink

flink

我所在公司和大数据

2流程序员

Docker 私有镜像仓库的搭建及认证

哈喽沃德先生

Docker 容器 微服务 镜像

Atlassian Team Playbook | 用户体验画布挖掘业务价值

Atlassian

团队管理 敏捷开发 Atlassian

大数据解答(一)

dony.zhang

大数据 mapreduce

计算机网络基础(二十二)---传输层-套接字与套接字编程

书旅

TCP 计算机网络 TCP/IP

区块链支付新模式开发,USDT支付系统搭建

13530558032

Week 12 命题作业

Jeremy

互联网人必备知识cookie和session认证

架构师修行之路

分布式 身份认证 session Cookie

oeasy教您玩转linux010201持续输出yes

o

所按非所得——聊一聊StandHogg漏洞

OPPO安全

安全攻防 安全 安全开发 漏洞

文本表示与文本生成模型新进展与应用_AICon_李磊_InfoQ精选文章