写点什么

大模型竞争突然升级!亚马逊 CEO 亲自监督、组建新的核心技术团队,集中优势资源打造“最具野心”的大语言模型

  • 2023-08-02
    北京
  • 本文字数:2765 字

    阅读完需:约 9 分钟

大模型竞争突然升级!亚马逊CEO亲自监督、组建新的核心技术团队,集中优势资源打造“最具野心”的大语言模型

亚马逊“最具野心”的大语言模型,将会是什么样?

亚马逊被曝组建新团队研发大语言模型

 

据外媒 Insider 近日报道,亚马逊 CEO Andy Jassy 目前正直接领导一支新团队,负责开发该公司最具野心的 AI 项目。

 

Jassy 告知亚马逊的 S-team(由 20 多名高管组成的亚马逊最高决策团队),他将提拔 Alexa 首席科学家兼高级副总裁 Rohit Prasad 作为自己的直接下属,向他直接汇报。目前 Jassy 共有 16 名直接下属,包括 Devices and Services 高级副总裁 Dave Limp、零售业务负责人 Doug Herrington、云计算 CEO Adam Selipsky 以及 CFO Brian Olsavsky 等。

 

根据 Insider 获得的一封内部邮件,Prasad 将在新位置上组织建立新的技术小组,致力于为亚马逊打造“最具野心”的大语言模型。

 

大语言模型是 AI 工具中的底层技术,能够从巨大的训练数据集中学会生成与人类相似的响应结果。OpenAI、谷歌和 Meta 等企业都已建立起规模庞大、功能强劲的大语言模型,并在全球范围起掀起热潮。亚马逊之前也有相关布局,成果包括 Alexa Techer Model 和 Titan。

 

在 6 月末发出的这封邮件中,Jassy 称 Prasad 将领导一支“中央小组”,负责构建亚马逊“最具泛用性”的大语言模型。

 

“简单说一下,Prasad 将调任新岗位,负责领导一支中央小组并构建我们最具泛用性的大语言模型。虽然我们已经在公司内部构建起多个大语言模型,还有另外几个项目也在推进,但这次我们将集中优势资源打造最具野心的大语言模型,并由 Prasad 领导这支队伍。在新岗位上,Prasad 将向我直接报告。”

 

资料显示,Prasad 统领 Alexa 团队已经超过十年,同时他也是 Dave Limp 领导的亚马逊 Devices and Services 团队中的一员,并将继续承担这方面工作。

 

根据 Insider 看到的另一封邮件,就在 Jassy 于 6 月宣布上述决定后不久,Limp 在团队内部发出通告,称 Prasad 仍将是“Alexa 的关键合作伙伴与支持者,并将在我们的未来业务中发挥重要作用。”这封邮件称,亚马逊 Devices 副总裁 Daniel Rausch 将接掌 Alexa 产品与业务组织,包括各娱乐、合作伙伴参与及跨国团队。

 

Limp 在邮件中强调,“我们在 Alexa 的使命和愿景上没有动摇,对于我们向客户交付新发明、新成果的能力,我也比以往任何时候都更加乐观。”有消息显示,亚马逊最近还启动另一个新项目,希望利用类似 ChatGPT 的技术让 Alexa 变得更智能、更富个性化。

 

目前关于 Prasad 领导的新团队并未有更多消息流出,但可以看到,亚马逊在这场大模型竞赛中已经准备好了,至于未来能带来什么样的惊喜,还需要交给时间。

亚马逊入局“大模型之战”

 

根据 Insider 之前的报道,亚马逊正急于应对生成式 AI 的迅速崛起。尽管亚马逊过去数十年间一直致力于 AI 技术研究,但微软、OpenAI 和谷歌等竞争对手明显取得了一定优势,Meta 最新的 Llama 2 模型也在整个科技行业内掀起了波澜。为此,亚马逊决定在新计划中立足亚马逊云科技事业部组建新团队,专注于帮助客户使用生成式 AI 产品。

亚马逊的 AI 产品布局

 

在这场大模型竞赛中,亚马逊云科技已经交出过不少答卷。今年 4 月,亚马逊推出了 Amazon Bedrock 服务、Amazon Titan 大语言模型,以及 AI 编码助手 Amazon CodeWhisperer。

 

其中,Amazon Bedrock 既提供自研的大语言基础模型—— Amazon Titan Text 、Amazon Titan Embeddings,也与 AI21 Labs、Anthropic、Stability AI 等基础模型提供商广泛合作,助力企业轻松灵活构建生成式 AI 应用,降低所有开发者的使用门槛。

 

Andy Jassy 在此前接受 CNBC 采访时表示,“大多数企业都想要用上大语言模型,但顶尖 AI 模型需要几十亿美元和长达数年的训练成本和周期,用户肯定不想亲自动手。因此,他们希望能在规模够大、性能更好的基础模型之上工作,再根据自身需求对其做出定制。而这,就是 Bedrock 的基本定位。”

 

Amazon Titan 基础模型可以识别和删除客户提交给定制模型的数据中的有害内容,拒绝用户输入不当内容,过滤模型中不当内容的输出结果。Titan 系列模型分为两种,一种是用于内容生成的文本模型,另一种是可创建矢量嵌入的嵌入模型,用于创建高效搜索功能等。

 

AI 模型经常会出现“一本正经地胡说八道”现象,尽管输出内容看似有理有据、令人信服,但实际上并没有相关训练数据可以支撑。针对 AI “幻觉”问题,亚马逊云科技副总裁 Bratin Saha 此前在接受外媒采访时表示,亚马逊非常关心准确性,并努力确保 Titan 模型能够生成高质量的响应结果。

 

据外媒报道,十几年前起就一直在亚马逊工作的 Sivasubramanian 表示,亚马逊在 AI 领域已经持续投入二十多年,亚马逊云科技目前拥有超过 10 万家 AI 相关客户。他同时补充称,亚马逊也一直在使用 Titan 的微调版本交付主页上的搜索结果。

 

Amazon CodeWhisperer 则是一款面向个人开发者免费使用的辅助代码编写工具,是一种人工智能代码生成扩展,目标是提高软件开发者的工作效率。CodeWhisperer 可以更快地完成更多工作,避免软件开发人员花费大量时间编写非常简单且无差别的代码,CodeWhisperer 作为 AI 编码伴侣,它能根据开发人员的自然语言评论和集成开发环境 ( IDE ) 中的先前代码实时生成代码建议,从根本上提高开发人员的工作效率。

“大型语言模型和生成式 AI 对亚马逊意义重大”

 

在发布上述 AI 服务/产品的同一天,亚马逊还发布了 2022 年度股东信,Jassy 在信中提到,公司正大力投资大型语言模型和生成式 AI。

 

Jassy 表示,LLM 和生成式 AI 是能让“亚马逊未来几十年可以在每个业务领域都进行创新的核心”,将显著加速亚马逊已经深耕了 25 年的机器学习的应用,他称生成式 AI 具有变革性,对客户、股东和亚马逊来说都意义重大:

 

“亚马逊研发自己的 LLM 已有一段时间了,相信它将改变并改善几乎每一种客户体验,并将继续在所有我们的消费者、卖家、品牌和创作者体验中大量投资这些模型。

 

与多年来亚马逊云科技的发展路径一样,我们正在推动各种规模的公司都可以利用生成式人工智能。亚马逊云科技提供了最具性价比的机器学习芯片 Trainium 和 Inferentia,使得小型和大型公司都可以负担得起在生产中训练和运行他们的 LLMs。

 

亚马逊的商业客户可以从各种 LLMs 中进行选择,并使用客户喜好的所有 AWS 安全、隐私和其他功能构建应用程序。此外,我们正在提供像 AWS CodeWhisperer 这样的应用程序,它通过实时生成代码建议来革命性地提高开发者的生产力。”

 

Jassy 最后提到,他本可以用生成式人工智能写一整封信,但他要把这封信留到未来。大型语言模型和生成式人工智能对客户、股东和亚马逊来说都将是一件大事。

 

参考链接:

https://www.businessinsider.com/amazon-ceo-andy-jassy-oversees-group-most-ambitious-ai-models-2023-7

https://www.infoq.cn/article/j3qbSPiG9Hmapal2exir

https://www.cnbc.com/2023/04/13/aws-launches-bedrock-generative-ai-service-titan-llms.html

2023-08-02 15:053601

评论

发布
暂无评论
发现更多内容

为什么国企要加快推进数字化转型?

用友BIP

数字化转型 用友 用友iuap 用友YonBIP 国企

异步请求积压可视化|如何 1 分钟内快速定位函数计算积压问题

Serverless Devs

COPT4.0新增凸QP、QCP和QCQP求解能力

杉数科技

求解器 优化求解器 凸QP 凸QCP

新插件上线,public API 处理能力更进一步

API7.ai 技术团队

HTTP APISIX APISIX 网关

企业级 APIs 安全实践指南 (建议初中级工程师收藏)

领创集团Advance Intelligence Group

API

浅析企业云服务之SaaS、PaaS、IaaS对比分析

郑州埃文科技

IaaS PaaS SaaS

Window下Redis的安装和部署详细教程

明金同学

redis

Apache APISIX 集成 HashiCorp Vault,生态系统再添一员

API7.ai 技术团队

开源 安全 后端 API网关 APISIX

计算IIS

杉数科技

求解器 优化求解器 计算IIS 混合整数规划 杉数科技

极速生成缩略图,Serverless 支撑赛事转播锁定冬奥亮点

Serverless Devs

JWT Token在线编码生成

入门小站

工具

APP热更新技术最优解,不只是支持热更新...

Speedoooo

小程序 APP开发 容器安全 热更新 小程序容器

2022写作计划2月文章排行榜

TGO鲲鹏会

TGO鲲鹏会 写作计划

万字通俗讲解何为复杂度

华为云开发者联盟

数据结构 时间复杂度 复杂度 空间复杂度 复杂度分许

Apache APISIX 新技能,代理 gRPC-Web 请求

API7.ai 技术团队

gRPC HTTP 网关 APISIX

阿里云资深专家李国强:云原生的一些趋势和新方向

Serverless Devs

常青藤开源科技加入,龙蜥社区再迎 HPC 和开源领域新伙伴

OpenAnolis小助手

Linux 开源 高性能计算

生态扩大进行中!Apache APISIX 集成 Splunk HTTP Event Collector

API7.ai 技术团队

API网关 Apache APISIX

斯图飞腾Stratifyd入选「2022爱分析·营销科技厂商全景报告」

Geek_2d6073

如何在设计时保证RPA机器人的稳定运行?

金小K

【场景化集成方案】如何让企业快速集成钉钉各种能力

钉钉开发者

钉钉能力中心 钉钉官网 场景化能力包 场景化解决方案 应用集成方案

第十五节:SpringBoot使用JPA访问数据库

入门小站

spring-boot

Apache APISIX 集成 Open Policy Agent

API7.ai 技术团队

开源 后端 API网关 OPA Apache APISIX

云服务器ECS选购指南及省钱法宝(强烈建议收藏)

阿里云弹性计算

玩转ECS 选购指南

使用goofys挂载S3 bucket为文件系统

阿呆

文件系统 goofys aws s3

Nacos 在 Apache APISIX API 网关中的服务发现实践

API7.ai 技术团队

nacos 注册中心 服务发现 API网关 APISIX

学生外包管理系统架构设计文档

孙强

#架构实战营

你知道钓鱼网站的形成步骤吗?一次网络钓鱼演练带你了解(增强安全意识)

H

网络安全 钓鱼网站

如何使用 Apache APISIX CSRF 安全插件拦截跨站点伪造攻击

API7.ai 技术团队

CSRF API网关 Apache APISIX

生态扩大进行中!Apache APISIX 支持 Azure Functions 集成

API7.ai 技术团队

microsoft azure API网关 Apache APISIX

StarRocks 元数据管理及 FE 高可用机制

邸星星

BerkeleyDB-JE bdbje StarRocks元数据管理

大模型竞争突然升级!亚马逊CEO亲自监督、组建新的核心技术团队,集中优势资源打造“最具野心”的大语言模型_生成式 AI_凌敏_InfoQ精选文章