HarmonyOS开发者限时福利来啦!最高10w+现金激励等你拿~ 了解详情
写点什么

大模型竞争突然升级!亚马逊 CEO 亲自监督、组建新的核心技术团队,集中优势资源打造“最具野心”的大语言模型

  • 2023-08-02
    北京
  • 本文字数:2765 字

    阅读完需:约 9 分钟

大模型竞争突然升级!亚马逊CEO亲自监督、组建新的核心技术团队,集中优势资源打造“最具野心”的大语言模型

亚马逊“最具野心”的大语言模型,将会是什么样?

亚马逊被曝组建新团队研发大语言模型

 

据外媒 Insider 近日报道,亚马逊 CEO Andy Jassy 目前正直接领导一支新团队,负责开发该公司最具野心的 AI 项目。

 

Jassy 告知亚马逊的 S-team(由 20 多名高管组成的亚马逊最高决策团队),他将提拔 Alexa 首席科学家兼高级副总裁 Rohit Prasad 作为自己的直接下属,向他直接汇报。目前 Jassy 共有 16 名直接下属,包括 Devices and Services 高级副总裁 Dave Limp、零售业务负责人 Doug Herrington、云计算 CEO Adam Selipsky 以及 CFO Brian Olsavsky 等。

 

根据 Insider 获得的一封内部邮件,Prasad 将在新位置上组织建立新的技术小组,致力于为亚马逊打造“最具野心”的大语言模型。

 

大语言模型是 AI 工具中的底层技术,能够从巨大的训练数据集中学会生成与人类相似的响应结果。OpenAI、谷歌和 Meta 等企业都已建立起规模庞大、功能强劲的大语言模型,并在全球范围起掀起热潮。亚马逊之前也有相关布局,成果包括 Alexa Techer Model 和 Titan。

 

在 6 月末发出的这封邮件中,Jassy 称 Prasad 将领导一支“中央小组”,负责构建亚马逊“最具泛用性”的大语言模型。

 

“简单说一下,Prasad 将调任新岗位,负责领导一支中央小组并构建我们最具泛用性的大语言模型。虽然我们已经在公司内部构建起多个大语言模型,还有另外几个项目也在推进,但这次我们将集中优势资源打造最具野心的大语言模型,并由 Prasad 领导这支队伍。在新岗位上,Prasad 将向我直接报告。”

 

资料显示,Prasad 统领 Alexa 团队已经超过十年,同时他也是 Dave Limp 领导的亚马逊 Devices and Services 团队中的一员,并将继续承担这方面工作。

 

根据 Insider 看到的另一封邮件,就在 Jassy 于 6 月宣布上述决定后不久,Limp 在团队内部发出通告,称 Prasad 仍将是“Alexa 的关键合作伙伴与支持者,并将在我们的未来业务中发挥重要作用。”这封邮件称,亚马逊 Devices 副总裁 Daniel Rausch 将接掌 Alexa 产品与业务组织,包括各娱乐、合作伙伴参与及跨国团队。

 

Limp 在邮件中强调,“我们在 Alexa 的使命和愿景上没有动摇,对于我们向客户交付新发明、新成果的能力,我也比以往任何时候都更加乐观。”有消息显示,亚马逊最近还启动另一个新项目,希望利用类似 ChatGPT 的技术让 Alexa 变得更智能、更富个性化。

 

目前关于 Prasad 领导的新团队并未有更多消息流出,但可以看到,亚马逊在这场大模型竞赛中已经准备好了,至于未来能带来什么样的惊喜,还需要交给时间。

亚马逊入局“大模型之战”

 

根据 Insider 之前的报道,亚马逊正急于应对生成式 AI 的迅速崛起。尽管亚马逊过去数十年间一直致力于 AI 技术研究,但微软、OpenAI 和谷歌等竞争对手明显取得了一定优势,Meta 最新的 Llama 2 模型也在整个科技行业内掀起了波澜。为此,亚马逊决定在新计划中立足亚马逊云科技事业部组建新团队,专注于帮助客户使用生成式 AI 产品。

亚马逊的 AI 产品布局

 

在这场大模型竞赛中,亚马逊云科技已经交出过不少答卷。今年 4 月,亚马逊推出了 Amazon Bedrock 服务、Amazon Titan 大语言模型,以及 AI 编码助手 Amazon CodeWhisperer。

 

其中,Amazon Bedrock 既提供自研的大语言基础模型—— Amazon Titan Text 、Amazon Titan Embeddings,也与 AI21 Labs、Anthropic、Stability AI 等基础模型提供商广泛合作,助力企业轻松灵活构建生成式 AI 应用,降低所有开发者的使用门槛。

 

Andy Jassy 在此前接受 CNBC 采访时表示,“大多数企业都想要用上大语言模型,但顶尖 AI 模型需要几十亿美元和长达数年的训练成本和周期,用户肯定不想亲自动手。因此,他们希望能在规模够大、性能更好的基础模型之上工作,再根据自身需求对其做出定制。而这,就是 Bedrock 的基本定位。”

 

Amazon Titan 基础模型可以识别和删除客户提交给定制模型的数据中的有害内容,拒绝用户输入不当内容,过滤模型中不当内容的输出结果。Titan 系列模型分为两种,一种是用于内容生成的文本模型,另一种是可创建矢量嵌入的嵌入模型,用于创建高效搜索功能等。

 

AI 模型经常会出现“一本正经地胡说八道”现象,尽管输出内容看似有理有据、令人信服,但实际上并没有相关训练数据可以支撑。针对 AI “幻觉”问题,亚马逊云科技副总裁 Bratin Saha 此前在接受外媒采访时表示,亚马逊非常关心准确性,并努力确保 Titan 模型能够生成高质量的响应结果。

 

据外媒报道,十几年前起就一直在亚马逊工作的 Sivasubramanian 表示,亚马逊在 AI 领域已经持续投入二十多年,亚马逊云科技目前拥有超过 10 万家 AI 相关客户。他同时补充称,亚马逊也一直在使用 Titan 的微调版本交付主页上的搜索结果。

 

Amazon CodeWhisperer 则是一款面向个人开发者免费使用的辅助代码编写工具,是一种人工智能代码生成扩展,目标是提高软件开发者的工作效率。CodeWhisperer 可以更快地完成更多工作,避免软件开发人员花费大量时间编写非常简单且无差别的代码,CodeWhisperer 作为 AI 编码伴侣,它能根据开发人员的自然语言评论和集成开发环境 ( IDE ) 中的先前代码实时生成代码建议,从根本上提高开发人员的工作效率。

“大型语言模型和生成式 AI 对亚马逊意义重大”

 

在发布上述 AI 服务/产品的同一天,亚马逊还发布了 2022 年度股东信,Jassy 在信中提到,公司正大力投资大型语言模型和生成式 AI。

 

Jassy 表示,LLM 和生成式 AI 是能让“亚马逊未来几十年可以在每个业务领域都进行创新的核心”,将显著加速亚马逊已经深耕了 25 年的机器学习的应用,他称生成式 AI 具有变革性,对客户、股东和亚马逊来说都意义重大:

 

“亚马逊研发自己的 LLM 已有一段时间了,相信它将改变并改善几乎每一种客户体验,并将继续在所有我们的消费者、卖家、品牌和创作者体验中大量投资这些模型。

 

与多年来亚马逊云科技的发展路径一样,我们正在推动各种规模的公司都可以利用生成式人工智能。亚马逊云科技提供了最具性价比的机器学习芯片 Trainium 和 Inferentia,使得小型和大型公司都可以负担得起在生产中训练和运行他们的 LLMs。

 

亚马逊的商业客户可以从各种 LLMs 中进行选择,并使用客户喜好的所有 AWS 安全、隐私和其他功能构建应用程序。此外,我们正在提供像 AWS CodeWhisperer 这样的应用程序,它通过实时生成代码建议来革命性地提高开发者的生产力。”

 

Jassy 最后提到,他本可以用生成式人工智能写一整封信,但他要把这封信留到未来。大型语言模型和生成式人工智能对客户、股东和亚马逊来说都将是一件大事。

 

参考链接:

https://www.businessinsider.com/amazon-ceo-andy-jassy-oversees-group-most-ambitious-ai-models-2023-7

https://www.infoq.cn/article/j3qbSPiG9Hmapal2exir

https://www.cnbc.com/2023/04/13/aws-launches-bedrock-generative-ai-service-titan-llms.html

2023-08-02 15:053428

评论

发布
暂无评论
发现更多内容

让 AI 帮你写代码,开发提效神器来了

阿里巴巴云原生

阿里云 AI 云原生

Partisia Blockchain:真正做到兼顾隐私、高性能和可拓展的公链

股市老人

一文读懂兼顾隐私、高性能和可拓展的公链Partisia Blockchain

BlockChain先知

移动应用开发工具及其影响

雪奈椰子

工作中总结的30个常用Linux指令,实在记不住就别硬记了,看这篇就够了

快乐非自愿限量之名

Linux 运维 服务器

Golang DB连接池ErrBadConn的应用

三七互娱后端技术团队

golang MySQL

What's new in PikiwiDB (Pika) v3.5.3 (正式版)

apache/dubbo-go

nosql redis

2024-03-27:用go语言,多维费用背包。 给你一个二进制字符串数组 strs 和两个整数 m 和 n, 请你找出并返回 strs 的最大子集的长度,该子集中 最多 有 m 个 0 和 n 个

福大大架构师每日一题

福大大架构师每日一题

类似trello的局域网开源的软件

爱吃小舅的鱼

项目管理 项目管理工具 Trello

适合老师使用的在线教学软件推荐!这一款千万别错过。

彭宏豪95

在线教育 在线白板 办公软件 教学 效率软件

华为云GeminiDB发布新版本,全面支持Redis 6.2

平平无奇爱好科技

GeminiDB新特性:让Redis广告频控爱不释手的exHASH

平平无奇爱好科技

大模型的 Token 使用详解:限制与注意事项

木南曌

大模型

小程序应用市场发展趋势分析

Onegun

小程序 小程序平台

中国超高清自有珠穆朗玛:双Vivid是什么?

脑极体

音视频

堪称教学神器的5款软件,每一款都值得推荐!

彭宏豪95

效率工具 在线教育 在线白板 办公软件 在线协作

业内首个!央广网APP率先完成鸿蒙原生应用全量版本开发,领跑鸿蒙化进程

最新动态

Jetson Xavier nx 全盘加密

一五

AI 边缘计算 jetson 全盘加密 jetson xavier nx

浅析KV存储之长尾时延问题,探寻行业更优解决方案!

平平无奇爱好科技

Partisia Blockchain:如何做到兼顾隐私、高性能和可拓展?

石头财经

足球场上的黑科技:图神经网络优化角球

算AI

#人工智能

28+岗位!百度安全2025届实习生招聘火热进行中

百度安全

C++ 运算符全解析:从基础概念到实际应用

小万哥

程序人生 编程语言 软件工程 C/C++ 后端开发

在 ASP.NET Core 中使用 HttpClient

雄鹿 @

ASP.NET Core

【干货分享】华为云多模数据库GeminiDB架构与应用实践直播问答实录

平平无奇爱好科技

怎样让 API 快速且轻松地提取所有数据?

技术冰糖葫芦

API 接口 API 文档

一文读懂兼顾隐私、高性能和可拓展的公链Partisia Blockchain

股市老人

新版Redis不再“开源”,对使用者都有哪些影响?

平平无奇爱好科技

究竟什么样的数据库,才能承接RTA广告这个技术活!

平平无奇爱好科技

华为云原生多模数据库GeminiDB架构与应用实践

平平无奇爱好科技

大模型竞争突然升级!亚马逊CEO亲自监督、组建新的核心技术团队,集中优势资源打造“最具野心”的大语言模型_生成式 AI_凌敏_InfoQ精选文章