写点什么

加速开源 AI 大模型开发和部署,红帽公司推出 RHEL AI,开发者预览版已上线

  • 2024-05-10
    北京
  • 本文字数:1786 字

    阅读完需:约 6 分钟

大小:887.99K时长:05:03
加速开源AI大模型开发和部署,红帽公司推出RHEL AI,开发者预览版已上线

近日,红帽公司(Red Hat)在科罗拉多州丹佛市举办了 2024 年红帽峰会。会上,红帽公司宣布推出红帽企业 Linux AI(RHEL AI),这是一款基础模型平台,旨在简化生成式人工智能(GenAI)模型的开发、测试和部署流程。

 

RHEL AI 平台整合了 InstructLab 项目,该项目基于 IBM 研究院开发的大规模对话机器人对齐(LAB)技术,通过分类指导合成数据生成和创新的多阶段调整框架,实现了 AI 模型开发的开放性和易接触性。InstructLab 项目允许开发者通过指定分类下的技能和知识,大规模生成影响模型的合成数据,并利用这些数据训练模型,从而显著减少了对昂贵人工注释和专有模型的依赖。

 


此外,RHEL AI 还集成了 Granite 系列模型,这是 IBM 首个从零开始在最大的可信企业级数据湖上训练开发的生成式大模型集合。Granite 模型采用仅解码器架构,适用于多种自然语言处理任务,包括文本生成、问答系统等。通过将这些模型与 RHEL AI 平台相结合,企业可以更加便捷地利用这些先进的 AI 技术,推动业务创新。

 

该解决方案被封装成一个优化的、可启动的 RHEL 镜像,用于在混合云环境中部署单个服务器,并已集成到 OpenShift AI 中。OpenShift AI 是红帽的混合机器学习运营(MLOps)平台,能够在分布式集群环境中大规模运行模型和 InstructLab。

 

随着 ChatGPT 等生成式 AI 技术的兴起,企业对于 AI 应用的需求日益增加。然而,AI 技术的复杂性和高昂的成本成为了企业实施 AI 策略的障碍。为了降低 AI 创新的门槛,红帽公司通过 RHEL AI 平台,将开源项目的优势引入生成式 AI 领域,为企业提供了更加便捷、经济高效的解决方案。

 

红帽公司表示,RHEL AI 平台的推出将为企业带来诸多优势。首先,通过整合开源授权的 Granite 模型和 InstructLab 工具,RHEL AI 为企业提供了更加灵活、可扩展的 AI 解决方案,使企业能够根据自身需求定制 AI 模型。其次,RHEL AI 平台基于红帽企业 Linux 构建,提供了强大的企业级支持和生命周期保证,确保了 AI 系统的稳定性和可靠性。最后,通过结合红帽 OpenShift AI 平台,企业可以更加便捷地在大规模环境中训练和部署 AI 模型,实现 AI 应用的快速迭代和优化。

 

红帽企业 Linux AI 提供的功能和服务包括:

 

  • 红帽支持和保障的开源许可 Granite 语言和代码模型;

  • 提供支持并具有生命周期管理的 InstructLab 分发版本,这是一种可扩展且成本效益高的解决方案,能够增强大型语言模型(LLM)的功能,并使知识与技能的贡献得到更广泛的用户接纳;

  • 通过 RHEL 镜像方式提供的优化可启动模型运行实例,包括 Granite 模型和 InstructLab 工具包,及优化的 Pytorch 运行时库和针对 AMD Instinct™ MI300X、Intel 和 NVIDIA GPU 以及 NeMo 框架的加速器;

  • 红帽提供的完整企业支持和生命周期保证,从可信的企业产品分发开始,提供 24 小时全天候生产支持和扩展的生命周期支持;

 

那么,RHEL AI 与我们现有的超级云平台有何不同呢?

 

红帽总裁兼 CEO Matt Hicks 表示:“RHEL AI 的主要目标是利用硬件加速,在未来几年内覆盖 NVIDIA、AMD、Intel 等各类硬件,进行模型的训练和运行。用户可以选择来自 Granite 系列的大型语言模型,它是一种语言代码模型,其中包含了商业术语,如版权问题下的赔偿条款,使其使用更为安全可靠。而我们现有的混合平台主要关注的是应用程序的生命周期,通常从 Linux 开始,然后转向 OpenShift、中间件和运行时环境。相较而言,RHEL AI 更专注于为大型语言模型创建业务安全、管理生命周期和提供可预测性,并使您能够对其进行修改。由于大型向量模型的更新速度更快,因此它们的生命周期会更短。这是一个专为引入新类别硬件而设计的堆栈,类似于我们推出 RHEL 时所做的工作,这次目标是支持大型语言模型,而不仅仅是传统的 Python、Perl 和 PHP 应用程序。我们对这个套件非常兴奋,因为它使客户更容易地在生产环境中运行这些模型,并对它们的功能和安全性有了更多信心。”

 

“对企业来说,生成式 AI(GenAI)代表了一次革命性的飞跃,但这需要企业真正部署起来,并针对其具体业务需求使用 AI 模型。通过结合红帽 OpenShift AI 的广泛应用,RHEL AI 和 InstructLab 项目旨在降低混合云中生成式 AI 所面临的多种挑战,从数据科学技能的限制到巨大的资源需求,同时促进企业的部署并推动上游社区的创新。”红帽高级副总裁兼首席产品官 Ashesh Badani 如是说。

 

值得一提的是,红帽企业 Linux AI 目前已作为开发者预览版提供。

 

开发者预览版地址:https://www.redhat.com/en/technologies/linux-platforms/enterprise-linux/ai

 

2024-05-10 16:546712
用户头像
李冬梅 加V:busulishang4668

发布了 965 篇内容, 共 561.7 次阅读, 收获喜欢 1119 次。

关注

评论

发布
暂无评论
发现更多内容

详细架构设计文档模板(笔记)

张祥

HTTP与HTTPS,HTTPS更加安全。

喀拉峻

网络安全 安全 信息安全 HTTP

腾讯云开源百万级服务发现和治理中心“北极星”,打造可持续微服务生态

科技热闻

FlyFish 1.0发布,新增4个可视化组件

云智慧AIOps社区

大前端 低代码 数据可视化

吐血整理:常用的大数据采集工具,你不可不知

小术晓术

大数据 数据采集

绝绝子!美团大牛吐血整理总结“消息队列核心知识笔记”是真的吊

编程 程序员 MQ 队列

还在刷面试题?NO!这份阿里内网Java面试通关手册才是你急需的

Java spring 面试 JVM mybatis

智能的统一哲学

木铎

人工智能 机器学习 智能

堪称神级的阿里巴巴“高并发”教程《基础+实战+源码+面试+架构》

Java 编程 程序员 高并发

安全漏洞之经典上传漏洞

网络安全学海

网络安全 信息安全 渗透测试 WEB安全 安全漏洞

电脑数据恢复用哪款软件比较好

淋雨

EasyRecovery

今天面了个腾讯拿38K出来的大佬,让我见识到了基础的天花板

收到请回复

Java 程序员 后端

腾讯安全推出御界NDR「横移检测版」,全面检测域渗透攻击

腾讯安全

IM开发基础知识补课(十):大型IM系统有多难?万字长文,搞懂异地多活!

JackJiang

架构设计 即时通讯 灾备 IM 异地多活

网络篇夺命连环12问

冇先生

基于SVDD算法的半监督风控模型

索信达控股

算法 风控模型 半督导算法

千万不要小瞧复杂度分析,代码详解复杂度的重要性

小Q

Java Python 学习 数据结构 算法

❤️这应该是Postman最详细的中文使用教程了❤️(新手使用,简单明了)

六十七点五

软件测试 性能测试 Postman 自动化测试 接口测试

外包学生管理系统架构文档

Steven

架构实战营

视频通信关键技术探索及实践

网易云信

音视频 通信云

Aeron是如何实现的?—— Conductor

BUG侦探

Aeron Conductor

ShowMeBug 黑科技丨一招快速实现架构绘图之鼠标同步

ShowMeBug

思维导图 实时同步 绘图库

架构实战营-模块三作业

无名

架构实战营 「架构实战营」

Apache Pulsar 在能源互联网领域的落地实践

Apache Pulsar

架构 云原生 Apache Pulsar 消息系统 用户案例 能源互联网

腾讯Q3财报:腾讯企点服务超100万家企业,显著降低客服成本

科技热闻

腾讯云数据库TDSQL首次登上财报!TDSQL在不同金融机构核心系统中的渗透率明显提升

科技热闻

Python代码阅读(第56篇):获取列表的前n个最大/最小值

Felix

Python 编程 列表 阅读代码 Python初学者

专题|防宕机,Pulsar 跨机房复制了解一下?

Apache Pulsar

云原生 中间件 Apache Pulsar 消息系统 防宕机 跨地域复制

第三阶段总结

张靖

#架构实战营

纳尼?华为首席架构师只用434页笔记,就将网络协议给拿下了

编程 程序员 面试 网络协议

ShowMeBug 中如何科学的识别用户浏览器?

ShowMeBug

大前端 浏览器 WebRTC

加速开源AI大模型开发和部署,红帽公司推出RHEL AI,开发者预览版已上线_生成式 AI_李冬梅_InfoQ精选文章