去年起,生成式 AI 技术的发展引起了广泛关注,其中就包括 OpenAI 的 ChatGPT 模型,ChatGPT 模型甚至可以算为自然语言处理领域的重要里程碑之一,不仅在各种应用场景中得到了广泛的应用,同时也激发了各大科技公司的竞争热情。
4 月 13 日,在 AIGC 圈内一直处于“隐身”状态的亚马逊云科技突然加入生成式 AI 竞赛。不鸣则已一鸣惊人,与大多服务 C 端用户的科技公司和那些选择在热点期发布 AIGC 产品不同的是,拥有丰富企业服务经验的云厂商亚马逊云科技打出了一套组合拳,结合多年对企业需求的观察,依托自己在云资源、云计算、机器学习技术研发等多方面的优势,从大模型到生成式 AI 工具,为大家交上了一份漂亮的答卷:
推出 Amazon Bedrock 服务和 Amazon Titan 大语言模型,以帮助云企业提高效率和创新能力;
提供两款基于自研 AI 训练 (Trainium) 与推理芯片 (Inferentia) 的专门针对生成式 AI 优化的高性价比的虚机实例 EC2 Trn1n 和 EC2 Inf2,帮助企业大幅节省生成式 AI 训练和推理的成本;
发布 AI 编码助手 Amazon CodeWhisperer,面向所有个人用户免费开放,不设任何资质或使用时长的限制!
一、意料之中:亚马逊云科技基于 2B 经验及 ML 优势交出“漂亮答卷”
在过去几个月,全球的科技公司几乎都发布了自家的 AIGC 类产品,生成式预训练语言模型更是成为了各家技术的博弈点。在这个过程中,亚马逊云科技的动作显得慢了一些,但其实一直在背后憋大招。上周五亚马逊云科技终于发布了生成式 AI 系列重磅产品,性能都颇为强悍,但也都在意料之中。
为什么会这样说?
以 ChatGPT 为代表的 AIGC 日益火热,让大家对 AI 技术产生了新关注。AIGC(生成式 AI)其背后的核心技术之一就是机器学习(ML),机器学习算法可以根据用户的输入和提示生成内容,这些内容包括但不限于文本和图片;机器学习模型则是基于大量数据进行预先训练的大模型,被称为基础模型(Foundation Models)。而机器学习创新一直是亚马逊云科技的 DNA。
我们能看到,亚马逊云科技多年来一直在不断降低机器学习技术的使用门槛,为机器学习提供高性能、可伸缩的基础设施和具有超高性价比的机器学习训练和推理,在人工智能和机器学习堆栈的三个层级都投入了众多技术研发成本,产出了不少重磅的产品组合。亚马逊云科技拥有超过 20 年人工智能和机器学习的实践经验,在赋能自有业务与千行百业创新方面做出了很多成绩。亚马逊云科技给企业提供的许多功能都是由机器学习驱动的,比如电商推荐引擎、运营中心捡货机器人的路径选择以及供应链、预测和产能规划等;又比如亚马逊云科技自己的 Prime Air(无人机)和 Amazon Go(线下无人零售实体店)中的计算机视觉场景中也都使用了深度学习技术。
这些技术上的积累,让亚马逊云科技站在了机器学习领域前沿,他们观察到目前机器学习技术正处于“拐点期”,计算能力提升、数据增长、模型复杂度提高三大因素正在驱动着机器学习技术的下一步演进。机器学习技术的演进直接带来了基础模型的爆发式增长,据亚马逊科技公开演讲中的数据,该类模型通常包含数十亿个参数或变量,像 2019 年最大的预训练模型是 3.3 亿个参数,但现在最大的模型的参数已超过 5000 亿,这相当于在这几年间,变量增加了 1600 倍。
同时,亚马逊云科技在与 Intuit、汤森路透、阿斯利康、法拉利、德甲联赛、3M 和宝马等数以万计的企业打交道的过程中,发现了许多企业对于生成式 AI 的诉求。根据当前大多业务的发展,企业需要能够直接找到并访问高性能基础模型,这些模型需要能够给出最匹配业务场景的优秀反馈结果。紧接着企业希望无缝与应用程序集成且无需管理大量基础设施集群的同时,还不会增加太多成本。在落地过程中,企业还需要自己的技术团队能够快速上手,能够基于基础模型利用自己具有“弹性”的数据构建差异化的应用程序。此外,企业需要在保证数据安全和隐私保护的同时,还能够控制数据共享和使用。
当下的企业需求确实比较复杂,但“复杂性”也不是一朝而成的,而亚马逊云科技作为行业发展的观察者,也早早就在机器学习方面做不同程度的技术探索,将这些企业痛点逐一击破。可以说,我们今天看到的亚马逊云科技发布的生成式 AI 和大模型产品,其实早就有迹可循。
图:在亚马逊云科技平台上构建生成式 AI
二、与众不同:亚马逊云科技的生成式 AI 主要面向企业
亚马逊云科技的天然基因就是有足够丰富的企业服务经验,所以与其他家推出的面向大众的 AIGC 类的产品不同,亚马逊云科技此次推出的产品,主要是瞄准了企业,深入对云基础设施和应用程序的变革,以推动生成式 AI 的创新。
为了解决企业需求,亚马逊云科技的生成式 AI 技术在过去几年里主要做了以下 5 方面的技术探索:
灵活性:从 AI21 Labs、Anthropic、Stability AI 以及 Amazon 构建的基础模型中选择,以找到适合企业使用的模型。
安全自定义:仅需数个已标记样本,就可为企业企业定制基础模型。由于所有数据均已加密,不会从亚马逊云科技虚拟私有云(VPC)泄露企业数据,所以数据将始终保持私密且机密。
成本效益不错的基础设施:利用由亚马逊云科技设计的机器学习芯片和 NVIDIA GPU 驱动的基础设施,可为生成式人工智能带来最佳性价比。经济有效地扩展基础设施,以训练和运行包含数千亿个参数的基础模型。
轻松上手基础模型构建:使用熟悉的控件与亚马逊云科技能力和服务,如 Amazon SageMaker 和 Amazon S3 的深度和广度的集成,快速将基础模型集成并部署到企业在亚马逊云科技上运行的应用程序和工作负载中。
生成式 AI 技术支持的解决方案:由于内置生成式人工智能,如 Amazon CodeWhisperer(一种人工智能编码伴侣)等服务可帮助企业提高效率。此外,可使用亚马逊云科技样例解决在方案部署中常见的生成式人工智能案例,如调用归纳总结与问答。此类解决方案将亚马逊云科技人工智能服务与领先的基础模型相结合。
在企业的期待中,亚马逊云科技在本次发布会中推出了 Amazon Bedrock 和 Amazon Titan 模型,借助基础模型构建和扩展生成式 AI 应用程序的最简单途径。Amazon Bedrock 既提供自研的大语言基础模型—— Amazon Titan Text 、Amazon Titan Embeddings,也与 AI21 Labs、Anthropic、Stability AI 等基础模型提供商广泛合作,助力企业轻松灵活构建生成式 AI 应用,降低所有开发者的使用门槛。
展开来讲就是,在 Bedrock 上,用户可以通过可扩展、可靠且安全的亚马逊云科技托管服务,访问从文本到图像的一系列强大的基础模型以及 Amazon Titan 基础模型。凭借 Bedrock 所带来的无服务器体验,企业可以快速找到适合自身业务的模型,在确保数据安全和隐私保护的前提下,使用自有数据基于基础模型进行个性化定制,将定制化模型集成并部署到他们已有的应用程序中,不需要管理其他任何基础设施。
Bedrock 最突出的能力就是极易定制模型,企业只需要向 Bedrock 提供 Amazon S3 中的 20 个标注好的数据示例,Bedrock 就可以针对特定任务完成模型微调,整个过程中,用户数据不会离开 VPC,有效地保证了用户的数据安全与隐私。
另外值得一提的是,Bedrock 还允许用户通过 API 访问来自 AI21 Labs、Anthropic、Stability AI 和亚马逊云科技的基础模型,Bedrock 的 serverless 方案,让用户只需调用 API,不需要关心底层基础设施,就可以轻松获得多语言 LLM 用于生成西班牙语 / 法语 / 德语 / 葡萄牙语 / 意大利语 / 荷兰语文本、LLM 用于会话和文本处理任务、文生图等大模型能力。
左:来自亚马逊云科技的基础模型;右:来自 AI21 Labs、Anthropic 和 Stability AI 的基础模型
为了持续推动生成式 AI 在企业落地更多优秀实践,亚马逊云科技发布的 Titan 基础模型可以识别和删除客户提交给定制模型的数据中的有害内容,拒绝用户输入不当内容,过滤模型中不当内容的输出结果。本次亚马逊云科技的发布会上主要发布了两个 Titan 模型——针对总结、文本生成、分类、开放式问答和信息提取等任务的“生成式大语言模型”及能够将文本输入翻译成包含语义的数字表达的“文本嵌入(embeddings)大语言模型”。虽然这种大语言模型不生成文本,但在个性化推荐和搜索等应用程序上面的表现却十分亮眼,因为相对于文字匹配,编码对比可以帮助模型反馈更相关的结果。
三、技术革命:生成式 AI 也需要生态
事实上,无论运行、构建还是定制基础模型,除了这些业务需求,企业技术的底层需要还是离不开高性能、低成本且为机器学习专门构建的基础设施。于是,亚马逊云科技不只是在模型上下功夫,在生态方面也做了一些努力。
亚马逊云科技扩大了对定制芯片的创新,在本次发布会上,亚马逊云科技全新推出了两款专门针对生成式 AI 优化的计算实例 EC2 Trn1n 实例和 EC2 Inf2。
图:亚马逊云科技专为生成式 AI 设计的加速器
其中需要说明的是,训练实例 EC2 Trn1 由其自研芯片 Trainium 支持,与其他任何 EC2 实例相比,可节省高达 50% 的训练成本,历经优化后,已经可以在与高达 800Gbps 的第二代 EFA(弹性结构适配器)网络相连的多个服务器上分发训练任务,但 Trn1n 实例更为强悍它可以提供 1600 Gbps 的网络带宽,专为大型网络密集型模型设计,其性能比 Trn1 高出 20%。
企业在超大规模集群中部署 Trn1 实例时,数量就已经可以扩展到在同一可用区中 3 万个 Trainium 芯片,相当于超过 6 exaflops 的计算能力。Helixon、Money Forward 和亚马逊云科技的搜索团队曾在使用 Trn1 实例后,将训练大规模深度学习模型的时间从几个月缩短到了几天。所以,如果不出意外,此次亚马逊云科技发布的性能全面提升的全新网络优化型 Trn1n 实例将会带给我们更多惊喜。
无独有偶,2018 年亚马逊云科技发布了首款推理专用芯片 Inferentia,亚马逊云科技使用 Inferentia 运行了数万亿次推理,节省了数亿美元的成本,此次推理实例 Inf2 则是基于其自研芯片 Inferentia2,针对运行数千亿个参数模型的大规模生成式 AI 应用程序进行了优化,吞吐量提高了 4 倍,延迟降低了 10 倍,从这个数据来看,亚马逊云科技再次帮助企业大幅节省了生成式 AI 训练和推理的成本。
此外,Inferentia2 还可实现加速器之间的超高速连接以支持大规模分布式推理,与同类 Amazon EC2 实例相比,这些能力将推理性价比提高了 40%,并把云中的推理成本降到最低,企业利用 Inferentia2 可将部分模型的吞吐量提升至原来的两倍。
除了在芯片方面的创新,亚马逊云科技还发布了 AI 编码助手 Amazon CodeWhisperer,这是一款面向个人开发者免费使用的辅助代码编写工具,是一种人工智能代码生成扩展,目标是提高软件开发者的工作效率。开发者可以在没有亚马逊云科技账户的情况下,用邮箱完成 CodeWhisperer 的注册后开始使用,同时该工具对开发者不设任何资质或使用时长的限制。
图:CodeWhisperer 三大能力
CodeWhisperer 可以更快地完成更多工作,避免软件开发人员花费大量时间编写非常简单且无差别的代码,CodeWhisperer 作为 AI 编码伴侣,它使用引擎盖下的 FM 通过根据开发人员的自然语言评论和集成开发环境 ( IDE ) 中的先前代码实时生成代码建议,从根本上提高开发人员的工作效率。
在软件供应链安全问题频发的今天,CodeWhisperer 有一个非常突出的亮点,其可以增强代码的安全性,该工具利用了亚马逊云科技在安全方面的积累来扫描各种安全问题,能自动扫描代码中的安全漏洞并帮用户修复。目前该工具提供 Python、Java、JavaScript、TypeScript、C#、Go、Kotlin、Rust、PHP 和 SQL 等十余种开发语言供开发者选择,同时开发者还可以通过在 VS Code、IntelliJ IDEA、Amazon Cloud9 等集成开发环境中的 Amazon Toolkit 插件访问 CodeWhisperer。
构建像 CodeWhisperer 这样强大的应用程序对开发人员来说是变革性的,但是从整个生成式 AI 生态的发展来看,利用正确的基础模型进行构建相关工具是非常有必要的。生成式 AI 的发展永远不仅仅是大模型,它需要在基础设施、一站式应用开发工具等层面“全面开花”,而亚马逊云科技已经为行业做出了一个很好的表率。
纵观整个行业的发展,对于云厂商来说,只有打造生态协同效应,切实帮助企业实现降本增效,才能走得更远。而形成“大小生态”的良好闭环是打造生态协同的必由之路,亚马逊云科技似乎就是在探索这样的一条路。人工智能作为云计算的一部分,人工智能产品构建自己的“AI 小生态”,通过“小生态”的构建去推动“云平台大生态”的发展,云厂商再利用“大生态”的势能反哺“AI 小生态”,转而促进单一 AI 能力的发展。
从目前亚马逊云科技搭建的“AI 小生态”来看,这些生成式 AI 能力和工具,不再是那些冰冷的性能提升数字,而是卓越性价比,为企业解决问题提供了切实可行的企业技术解决方案。回溯本身,亚马逊云科技之所以能够实现这些突破,源于将每一个客户的难题都视为一个新的探索方向,将“探索精神”和“创新精神”贯彻始终,输出接地气的技术能力和解决方案。不积跬步无以至千里,亚马逊云科技凭借其多年来积累的企业服务经验,深刻理解企业需求,并在实际业务中持续获取洞察,这必定能帮助亚马逊云科技在市场竞争中脱颖而出。
据悉,近期亚马逊云科技在生成式 AI 能力方面的发声不仅只有这一次发布会,有内部消息称,5 月 25 日将举办亚马逊云科技大模型及生成式 AI 发布深度解读大会,感兴趣的同学可以立即点击此处进行报名。
评论