写点什么

英伟达入局 AI 大模型“战场”:发布两项全新大型语言模型,推动 AI 和数字生物的发展

  • 2022-09-23
    北京
  • 本文字数:1152 字

    阅读完需:约 4 分钟

英伟达入局AI大模型“战场”:发布两项全新大型语言模型,推动AI和数字生物的发展

当地时间 9 月 20 日,NVIDIA 宣布发布两项全新大型语言模型(LLM)云 AI 服务——NVIDIA NeMo 大型语言模型服务NVIDIA BioNeMo LLM 服务。使开发者能够轻松调整 LLM 并部署定制的 AI 应用程序,其可用于内容生成、文本摘要、聊天机器人、代码开发,以及蛋白质结构和生物分子特性预测等。


NVIDIA NeMo LLM 服可提供一条快速路径,以便自定义和使用在多个框架上训练的大型语言模型。开发者可以在私有云和公有云上使用 NeMo LLM 部署企业 AI 应用,还可以通过云 API 体验 Megatron 530B(大型语言模型之一),也可以通过 LLM 服务开展实验。


NVIDIA BioNeMo 服务是云应用程序编程接口(API),它可以将 LLM 用例扩展到语言以外的科学应用中,加快制药和生物技术公司的药物研发速度。


NVIDIA 创始人兼首席执行官黄仁勋表示: “大型语言模型具有改变每个行业的潜力。通过对基础模型进行调整,可将 LLM 的力量带给数百万的开发者,让他们无需重新构建庞大的模型,即可创建各种语言服务并推动科学发现。”

NeMo LLM 通过提示学习提高准确性,加快部署速度


借助 NeMo LLM 服务,开发者可以使用自己的训练数据定制基础模型——从 30 亿个参数到世界上最大的 LLM 之一 Megatron 530B。与从头开始训练模型所需的数周或数月相比,该过程只需几分钟到几小时。

 

提示学习是使用一种名为 P-tuning 的技术来定制模型,使开发者只需使用几百个示例就能快速定制最初需要使用数十亿个数据点训练的基础模型。定制流程生成任务专属的提示标记,这些标记会与基础模型相结合,为特定用例提供更高的准确性和更相关的响应。

 

开发者可以使用同一模型定制多个用例并生成许多不同的 Prompt Token。游乐场功能提供可以轻松实验并与模型互动的无代码选项,进一步提高了 LLM 对行业特定用例的有效性和可及性。

 

一旦准备好部署,经过调整的模型即可在云实例、本地系统上或通过 API 运行。

BioNeMo LLM 使研究人员能够充分利用大规模模型的力量


BioNeMo LLM 服务包括两个用于化学和生物学应用的新 BioNeMo 语言模型。该服务提供蛋白质、DNA 和生物化学数据方面的支持,帮助研究人员发现生物序列中的模式和洞察。

 

BioNeMo 使研究人员能够利用包含数十亿个参数的模型来扩大研究范围。这些大型模型可以储存更多关于蛋白质结构、基因间进化关系的信息,甚至可以生成用于治疗的新型生物分子。


除了调整基础模型之外,LLM 服务还提供通过云 API 使用现成和定制模型的选项。

     

这让开发者可以访问包括 Megatron 530B 在内的各种预训练 LLM,以及使用 NVIDIA NeMo Megatron 框架创建的 T5 和 GPT-3 模型。NVIDIA NeMo Megatron 框架现已进入公测阶段,可支持各种应用和多语言服务需求。     

 

汽车、计算、教育、医疗、电信等行业的领导者正在使用 NeMo Megatron 为客户提供中文、英语、韩语、瑞典语等语言的服务。

2022-09-23 16:354400

评论

发布
暂无评论
发现更多内容

1年Java经验,信心满满出去面试,被问麻了...

Java永远的神

spring 程序员 后端 JVM Java 面试

概述DDoS分类

穿过生命散发芬芳

DDoS 11月月更

Oracle表空间设计基本原则

默默的成长

oracle 前端 11月月更

介绍:什么是智能合约dapp系统开发一站式服务

W13902449729

前行不缀 未来可期,鸿蒙生态发展迈入全新阶段

OpenHarmony开发者

OpenHarmony

docker 部署 apache 做反向代理

非晓为骁

Apache Docker 反向代理

九科信息荣获《2022爱分析RPA厂商全景报告》RPA软件市场代表厂商

九科Ninetech

应用防火墙WAF架构分类

阿泽🧸

waf 11月月更

oracle中计算两个日期的相差天数、月数、年数等等

默默的成长

oracle 前端 11月月更

HTML学习笔记(一)

lxmoe

html 前端 学习笔记 11月月更

云科通明湖:金融业务可持续性能力建设,少不了这块“拼图”!

通明湖

负载均衡

微服务先等等,我去刷个“虚拟背景”的副本

为自己带盐

虚拟背景 11月月更 trtc

SQL Sever 提供的数字类型

乔乔

数据库 11月月更 SQL sever

Oracle 开发规范(一)

默默的成长

oracle 前端 11月月更

阿里云机器学习平台 PAI宣布集成国产深度学习框架 OneFlow

阿里云大数据AI技术

机器学习 阿里云 oneflow

赋能信息技术应用创新,需要怎样的可持续性业务架构?

通明湖

负载均衡

云栖大会开源重磅升级!PolarDB-X v2.2: 企业级和国产化适配

阿里云数据库开源

阿里云 polarDB 云栖大会 PolarDB-X 阿里云数据库

什么是 NFT 蓝筹项目

NFT Research

区块链 NFT

如何通过Java将PDF转为Excel

Geek_249eec

Excel PDF java;

游戏链改NFT系统开发Web3技术

薇電13242772558

web3

RocketMQ核心技术

苏格拉格拉

RocketMQ 消息队列 消息中间件 微服务框架

网易云信智码超清转码技术实践

网易云信

音视频开发

新一代 CI 即将到来!

CODING DevOps

ci 持续集成 jenkins

Dubbo核心技术

苏格拉格拉

分布式 微服务 dubbo RPC 集群

双11就要到了,是时候给你的电脑来点硬货了!

淋雨

数据恢复 OCR 滤镜 录屏 磨皮

阿里进入“全面云原生深度用云”阶段 PaaS支出占用云总成本43%

阿里技术

云计算 云原生 云栖大会

使用 apache 给前后端服务做反向代理

非晓为骁

Apache 反向代理

最新的国内低代码开发平台排名,你知道几个?

优秀

低代码 低代码开发平台 低代码平台

因热爱而分享!阿里云开发者社区 X InfoQ创作者支持计划发布

阿里技术

深扒:基于UEBA的数据使用安全防护

极盾科技

Wallys/QCN9074 WiFi 6E Card OpenWRT, IPQ6010, IPQ6018,802.11ax,industrial m.2 card/QUECTEL RM500Q-GL

wallys-wifi6

IPQ6010 ipq6018 QCN9074

英伟达入局AI大模型“战场”:发布两项全新大型语言模型,推动AI和数字生物的发展_语言 & 开发_李冬梅_InfoQ精选文章