写点什么

艾伦人工智能研究所发布 AllenNLP 1.0 ,设计和评估新深度学习模型更容易

  • 2020-07-03
  • 本文字数:1693 字

    阅读完需:约 6 分钟

艾伦人工智能研究所发布 AllenNLP 1.0 ,设计和评估新深度学习模型更容易

本文最初发布在 Medium 博客,经原作者 Michael Schmitz 授权,InfoQ 中文站翻译并分享。


AI2 已发布其免费 NLP 库的官方版本 v1。AllenNLP 使得为几乎任何自然语言处理问题设计和评估新的深度学习模型变得更加容易,同时还提供了在云端或笔记本计算机上轻松运行这些模型的基础架构。

AllenNLP 1.0 现已发布

AllenNLP GitHub 项目地址:https://github.com/allenai/allennlp


AllenNLP 是一个来自 AI2 的免费、开源的自然语言处理平台,该平台的设计初衷是让研究人员能够轻松地构建最先进的模型。AllenNLP 通过提供与研究人员熟悉的概念相关的抽象和 API,以及一套近期文献中的参考实现,加快了将想法转化为有效模型的速度。最近,AI2 发布了 AllenNLP 1.0,为社区提供了新的模型、更好的性能以及新的资源。


AllenNLP 1.0 版本是 AI2 工程团队工作几个月以来的成果(包括超过 500 次 GitHub 提交),代表了该库重要的成熟里程碑。AI2 已经改进了平台的几乎每个角落,从文档到添加新的 NLP 组件,再到调整 API,从而使它们可以更好地为社区提供长期服务。



AllenNLP 演示中的命名实体识别示例。


需要注意的是,目前 AllenNLP 需要 Python 3.6.1 或更高版本。安装 AllenNLP 的首选方式是通过 pip。只需在 Python 环境中运行 pip install allennlp 即可。AllenNLP 支持 Linux 和 Mac OSX,尚不支持 Windows。


AllenNLP 库于 2017 年发布,提供了自然语言组件,研究人员可以轻松地构建新模型。模型架构可以由高级配置语言清楚地指定,这也为科学家们提供了一种简单的方法来实验不同的架构和参数。自发布以来,AllenNLP 已经发展到包括许多模型的参考实现,有超过 20 个模型的交互式演示。GitHub 上有 800 多个开源项目使用了这个库,学术出版物也引用了数百次。要了解更多关于 AllenNLP 平台的信息,请阅读白皮书或查看 AI2 的新指南


为了保持相关性,平台工程师与 AI2 的研究科学家紧密合作,他们正在自然语言处理和人工智能的前沿领域进行着更广泛的创新。ELMo 就是一个这样的例子,在论文《深层次上下文词表征》(Deep contextualized word representations)中已有描述,该论文首先展示了语言模型如何在各种任务中产生显著效果。(要了解更多关于这些模型及其影响的信息,请参阅《上下文词表征:将单词输入计算机》(Contextual Word Representations: Putting Words into Computers))AllenNLP 平台旨在加速新的研究,这些研究利用了 ELMo 等通用模块以及此后开发的其他模块。

版本 1.0 都包括什么?

版本 1.0 的主要亮点包括:


  1. 几个新模型,包括 TransformerQA共指模型(Coreference model)、NMN 阅读理解模型、以及用于文本蕴涵(Textual entailment,TE)的 RoBERTa 模型


译注:文本蕴涵(Textual entailment TE)在自然语言处理是一个文本片段之间的定向关系。拥有一个文本片段的含意时,可以从另一个文本如下关系。TE 的框架中,将会导致必须需要的文本被称为文本(T)和假设(H)作为分别。文本蕴涵是不一样的纯逻辑蕴涵,它有一个更宽松的定义:“T 推导到 H”(T⇒H),通常情况下,如果一个人阅读 T 将推断为 H 是最有可能的正确的关系。文本蕴含关系是有方向性的,如正向的“T 推导到 H”或反向的“H 推导到 T”。


  1. 新的《AllenNLP 指南》(AllenNLP Guide,),这是一个交互式资源,全面介绍了 AI2 的库和实验框架。

  2. 整个库的性能改进,包括切换到原生 PyTorch 数据加载,通过 Apex 启用对 16 位浮点的支持,以及提高多 GPU 训练的效率。

  3. 将模型拆分为单独的模型仓库(allennlp-models),从而提供一个具有较少依赖性的干净核心库。

  4. 将实验框架从核心库组件中解耦,无需实验框架即可更轻松地使用该库,并简化了过程中的配置文件。



AllenNLP 演示中的文本蕴涵示例。

AllenNLP 的下一步

现在版本 1.0 已经发布,AI2 正在壮大他们的平台团队,这样他们就可以更好地为科学家提供构建最先进的自然语言处理模型所需的研究成果。


AI2 计划继续在性能改进和基础设施方面进行投资,以使建立一个广泛的演示库变得更容易,并与 AI2 研究科学家密切合作,以确保该库能够跟上他们的最新研究。


原文链接:


https://medium.com/ai2-blog/allennlp-1-0-df0327445509


2020-07-03 08:001789
用户头像
刘燕 InfoQ高级技术编辑

发布了 1112 篇内容, 共 558.5 次阅读, 收获喜欢 1978 次。

关注

评论

发布
暂无评论
发现更多内容

对于Vue3和Ts的心得和思考

京东科技开发者

Vue ts 京东云 京东技术 企业号 3 月 PK 榜

GPT-4创造者:第二次改变AI浪潮的方向

OneFlow

在路上!OceanBase首次公布四大“开发者友好”实践

OceanBase 数据库

数据库 oceanbase

如何通过Java应用程序将PDF转为图片格式?

在下毛毛雨

PDF 图片 格式转换

PD虚拟机如何安装ARM版CentOS Linux系统镜像(苹果M1专用)

Rose

pd虚拟机 pd18虚拟机 CentOS Linux系统 Centos Stream 9

安全测试之探索windows游戏扫雷

京东科技开发者

编程 windows 企业号 3 月 PK 榜 动态调式 代码编写

Go 第三方 log 库之 zap 使用

江湖十年

后端 日志 Go 语言

graphpad prism教程:如何使用 prism医学绘图分析软件?

Rose

prism破解版 prism教程 医学绘图分析

博睿数据数智领航营首场开营:保险科技数智化转型中的智能运维实践

博睿数据

智能运维 博睿数据 数智化转型 保险行业

复杂「场景」数据导入导出

Java 架构

Spring源码核心剖析

京东科技开发者

spring 前端 京东云 京东技术 企业号 3 月 PK 榜

DevOps 在未来将如何演进?丨行业观察

SEAL安全

DevOps 平台工程

多功能文件搜索软件:HoudahSpot中文版

真大的脸盆

Mac Mac 软件 文件搜索 搜索工具 搜索文件

奇点云数据云平台如何确保“多租户”安全?从某大型零售企业实践说起

极客天地

mac版photoshop 2023存储为窗口显示空白、黑屏如何解决

Rose

PhotoShop ps2023存储空白 空白、黑屏

管理研发团队后,我发现用「速率」做度量错得离谱……

LigaAI

研发管理 研发效能 技术管理 效能度量 企业号 3 月 PK 榜

预约直播|3月30日下周四,应用促活大揭秘,快速提升DAU

HarmonyOS SDK

HMS Core

京东金融Android瘦身探索与实践

京东科技开发者

架构 sdk 安装包瘦身 APK 企业号 3 月 PK 榜

Sentinel Go- 揭秘 [热点参数] 的实现原理

柠檬汁Code(binbin0325)

golang 中间件 限流 原理分析 Sentienl

实战开发arthas-spring-boot-starter,监控你的微服务是否健康!

Java你猿哥

spring Spring Boot

强大的macOS效率工具,Alfred 5更新变动详解

Rose

Alfred Mac软件 Alfred 5 苹果效率工具

关于数据库分库分表的一点想法

京东科技开发者

数据库 ShardingSphere 京东云 京东技术 企业号 3 月 PK 榜

京东金融Android瘦身探索与实践

京东科技开发者

App 京东云 京东技术 企业号 3 月 PK 榜 京东科技

非常小的一个东西,Spring依赖注入Bean类型的8种情况

小小怪下士

Java spring 程序员 后端

想要找macOS系统上跑分工具?Geekbench 6帮助您快速,准确地测量处理器和内存性能进行测试

Rose

mac系统 系统跑分 Geekbench Geekbench 6

详细分析Spring Boot启动流程

Java你猿哥

spring Spring Boot SpringBoot启动流程

【ASPLOS 2023】图神经网络统一图算子抽象uGrapher,大幅提高计算性能

阿里云大数据AI技术

人工智能 机器学习 性能优化 图神经网络 企业号 3 月 PK 榜

机器学习系列入门系列[七]:基于英雄联盟数据集的LightGBM的分类预测

汀丶人工智能

数据挖掘 机器学习 LightGBM

艾伦人工智能研究所发布 AllenNLP 1.0 ,设计和评估新深度学习模型更容易_AI&大模型_Michael Schmitz_InfoQ精选文章