写点什么

英伟达入局 AI 大模型“战场”:发布两项全新大型语言模型,推动 AI 和数字生物的发展

  • 2022-09-23
    北京
  • 本文字数:1152 字

    阅读完需:约 4 分钟

英伟达入局AI大模型“战场”:发布两项全新大型语言模型,推动AI和数字生物的发展

当地时间 9 月 20 日,NVIDIA 宣布发布两项全新大型语言模型(LLM)云 AI 服务——NVIDIA NeMo 大型语言模型服务NVIDIA BioNeMo LLM 服务。使开发者能够轻松调整 LLM 并部署定制的 AI 应用程序,其可用于内容生成、文本摘要、聊天机器人、代码开发,以及蛋白质结构和生物分子特性预测等。


NVIDIA NeMo LLM 服可提供一条快速路径,以便自定义和使用在多个框架上训练的大型语言模型。开发者可以在私有云和公有云上使用 NeMo LLM 部署企业 AI 应用,还可以通过云 API 体验 Megatron 530B(大型语言模型之一),也可以通过 LLM 服务开展实验。


NVIDIA BioNeMo 服务是云应用程序编程接口(API),它可以将 LLM 用例扩展到语言以外的科学应用中,加快制药和生物技术公司的药物研发速度。


NVIDIA 创始人兼首席执行官黄仁勋表示: “大型语言模型具有改变每个行业的潜力。通过对基础模型进行调整,可将 LLM 的力量带给数百万的开发者,让他们无需重新构建庞大的模型,即可创建各种语言服务并推动科学发现。”

NeMo LLM 通过提示学习提高准确性,加快部署速度


借助 NeMo LLM 服务,开发者可以使用自己的训练数据定制基础模型——从 30 亿个参数到世界上最大的 LLM 之一 Megatron 530B。与从头开始训练模型所需的数周或数月相比,该过程只需几分钟到几小时。

 

提示学习是使用一种名为 P-tuning 的技术来定制模型,使开发者只需使用几百个示例就能快速定制最初需要使用数十亿个数据点训练的基础模型。定制流程生成任务专属的提示标记,这些标记会与基础模型相结合,为特定用例提供更高的准确性和更相关的响应。

 

开发者可以使用同一模型定制多个用例并生成许多不同的 Prompt Token。游乐场功能提供可以轻松实验并与模型互动的无代码选项,进一步提高了 LLM 对行业特定用例的有效性和可及性。

 

一旦准备好部署,经过调整的模型即可在云实例、本地系统上或通过 API 运行。

BioNeMo LLM 使研究人员能够充分利用大规模模型的力量


BioNeMo LLM 服务包括两个用于化学和生物学应用的新 BioNeMo 语言模型。该服务提供蛋白质、DNA 和生物化学数据方面的支持,帮助研究人员发现生物序列中的模式和洞察。

 

BioNeMo 使研究人员能够利用包含数十亿个参数的模型来扩大研究范围。这些大型模型可以储存更多关于蛋白质结构、基因间进化关系的信息,甚至可以生成用于治疗的新型生物分子。


除了调整基础模型之外,LLM 服务还提供通过云 API 使用现成和定制模型的选项。

     

这让开发者可以访问包括 Megatron 530B 在内的各种预训练 LLM,以及使用 NVIDIA NeMo Megatron 框架创建的 T5 和 GPT-3 模型。NVIDIA NeMo Megatron 框架现已进入公测阶段,可支持各种应用和多语言服务需求。     

 

汽车、计算、教育、医疗、电信等行业的领导者正在使用 NeMo Megatron 为客户提供中文、英语、韩语、瑞典语等语言的服务。

2022-09-23 16:354382

评论

发布
暂无评论
发现更多内容

迎接央行数字货币,你准备好了吗

CECBC

所谓的新型“数字人民币”诈骗,这里有几个疑点

CECBC

Elasticsearch中URI Search和RequestBody Search分析(1)

Java 程序员 后端

Flink SQL Client综合实战,深入理解java虚拟机百度云

Java 程序员 后端

Docker系列(1)--Docker原理及安装,java线程池回收原理

Java 程序员 后端

【死磕Java并发】-----Java内存模型之happens-before

chenssy

11月日更 死磕 Java 死磕 Java 并发

Elasticsearch 如何做到快速检索 - 倒排索引的秘密,springboot项目实战

Java 程序员 后端

Elasticsearch中的Term查询和全文查询,重磅

Java 程序员 后端

Elasticsearch聚合的嵌套桶如何排序,java架构和框架

Java 程序员 后端

ElasticSearch集群的概念及搭建过程,Java程序员晋升路线

Java 程序员 后端

flume基本概念与操作实例(常用source),kalilinux视频教程

Java 程序员 后端

【高并发】两种异步模型与深度解析Future接口

冰河

Java 并发编程 多线程 高并发 异步编程

Windows11 搭建openvino_tensorflow环境

IT蜗壳-Tango

IT蜗壳 OpenVINO 11月日更 openvino_tensorflow

ELK + Filebeat + Kafka 分布式日志管理平台搭建,最新java面试题及答案

Java 程序员 后端

Docker下,五分钟极速体验机器学习,java从入门到精通第五版防盗码

Java 程序员 后端

Flink处理函数实战之一:深入了解ProcessFunction的状态(Flink-1

Java 程序员 后端

WEB本地存储:localStorage、Web SQL Database、IndexedDB

devpoint

Cookie indexedDB LocalStorage sessionStorage 11月日更

Docker Swarm从部署到基本操作,Java程序员进大厂面试必备基础技能

Java 程序员 后端

Dubbo如何支持本地调用?InJvm方式解析,农民工看完都会了

Java 程序员 后端

Elasticsearch聚合的嵌套桶如何排序(1),java大学基础教程

Java 程序员 后端

ELK太重?试试KFC日志采集,2021大厂Java面试经验

Java 程序员 后端

【Promise 源码学习】第二篇 - Promise 功能介绍与特性分析

Brave

源码 Promise 11月日更

Flink的sink实战之四:自定义,Java开发笔试题目

Java 程序员 后端

Docker下Nacos配置应用开发,java初级程序员面试

Java 程序员 后端

Dubbo服务治理之灰度发布方案(版本发布控制影响范围)

Java 程序员 后端

进击的Java(一)

ES_her0

11月日更

讲分布式唯一id,这篇文章很实在

秦怀杂货店

Java 分布式 分布式ID

Dubbo服务消费者调用过程,35岁老年程序员的绝地翻身之路

Java 程序员 后端

Redis 实现附近的人,全靠 GEO 数据结构让我邂逅女神

码哥字节

redis BitMap geohash NoSQL 数据库 11月日更

各地力推“链长制”,区块链让产业链更加安全可靠

CECBC

Geospatial-地理空间,java面试基本知识

Java 程序员 后端

英伟达入局AI大模型“战场”:发布两项全新大型语言模型,推动AI和数字生物的发展_语言 & 开发_李冬梅_InfoQ精选文章