【AICon】AI 基础设施、LLM运维、大模型训练与推理,一场会议,全方位涵盖! >>> 了解详情
写点什么

欧洲版 OpenAI 被微软收编了,但这家号称专注于“开源”的大模型企业转向了”闭源“?

  • 2024-02-27
    北京
  • 本文字数:2320 字

    阅读完需:约 8 分钟

大小:1.04M时长:06:05
欧洲版OpenAI被微软收编了,但这家号称专注于“开源”的大模型企业转向了”闭源“?

今天,微软突然宣布与法国开源大模型初创公司 Mistral 达成深度合作。

 

Mistral AI 正式成立于 2023 年 5 月,估值 20 亿欧元(约合 21 亿美元)。双方将共同开展研发合作,并将 Mistral 的 AI 模型部署在微软 Azure 云计算平台上。这将使 Mistral 成为继 OpenAI 之后,第二家在 Azure 上提供商用语言模型的公司。

 

而且,据媒体透露,作为交易的一部分,微软还将对 Mistral 进行投资。这将使其成为继 OpenAI 之后,微软投资的第二家 AI 大模型公司。具体投资金额尚未披露。此前,微软投资 OpenAI 为 130 亿美元,持有 OpenAI 约 49%股份。

 


AI 新贵 Mistral 发布最新旗舰大模型

 

Mistral AI 也于今天宣布正式推出最新旗舰模型 Mistral Large。这是一种新的语言模型,旨在与 OpenAI 的 GPT-4 直接竞争。

 

Mistral AI 声称该模型具有“顶级的推理能力”,能用于处理复杂的多语言推理任务,包括文本理解、转换和代码生成。

 

在常用基准测试 MMLU 的对比中,Mistral Large 的得分仅次于 GPT-4,略好于 Anthropic 开发的 Claude 2。至于谷歌的 Gemini Pro 以及的 LLaMA 2 70B 模型,则被甩开了一个身位。

 


在推理能力上,Mistral Large 也仅次于 GPT-4,优于 LLaMA 2 70B 模型:

 


Mistral Large 具有本地多语言能力。它在法语、德语、西班牙语和意大利语的 HellaSwag、Arc Challenge 和 MMLU 基准测试中明显优于 LLaMA 2 70B。

 


各路网友纷纷对其进行了测试,表示其能力“仅次于 OpenAI”、“中文文本处理能力无限逼近 GPT-4”......

 



Mistral AI 在发布大模型的博客中,同时宣布将他们的开放式和商业模型引入到 Azure 中。所以现在访问 Mistral AI 的模型方式为:

 

  • La Plateforme:该平台托管在 Mistral 位于欧洲的基础设施上,使开发人员能够利用 Mistral AI 全系列模型构建应用程序和服务。

  • Azure:Mistral Large 已通过 Azure AI Studio 和 Azure Machine Learning 上线,用户体验顺畅,一些测试版客户已经在使用。

  • 自部署:对于最敏感的用例,用户可以在自己的环境中部署 Mistral AI 的模型,并访问其模型权重。

 

微软表示与 Mistral 的合作将帮助 Mistral 将其 AI 模型推向市场,并用于开发满足欧洲各国政府和公共部门需求的应用程序。

 

微软总裁 Brad Smith 发言称,微软与 Mistral 的合作,将推动 AI 技术在欧洲乃至全球的应用和发展。他认为,AI 将创造全新的业务和商业模式,并将对各个行业产生深远影响。

 

这次合作,让 Mistral 成为“闭源”公司?

 

微软首席执行官萨特亚·纳德拉 (Satya Nadella) 近日称赞了法国初创公司 Mistral AI,将其视为在 Azure 云计算平台上构建人工智能的创新者之一。

 

Mistral 由三位来自 Meta 和谷歌的前研究人员 Mensch、Timothée Lacroix 和 Guillaume Lample 创立,致力于构建大语言模型,这也是生成式 AI 产品的基础技术。

 


Mistral 于去年 12 月的融资中获得了 20 亿欧元的估值,融资金额约为 4 亿欧元。

 

据英国《金融时报》,该公司承诺将模型开源,这意味着技术细节将公开发布,这与竞争对手 (例如 ChatGPT 制造商 OpenAI) 的做法形成鲜明对比。OpenAI 最新的模型 GPT-4 是所谓的 “黑匣子”,用于构建模型的数据和代码不会提供给第三方。

 

Mistral 此前也一直专注于开源 AI 软件,他们坚信生成式 AI 技术应该是开源的,允许自由复制和修改 LLM 代码,通过这种方式帮助其他用户快速构建自己的聊天机器人。Mixtral 8x7b 则被许多人视为目前性能最好的开源 LLM。

 

但因为 Mistral 没有像往常一样提供 GitHub 或是下载链接,不少网友担心这家公司开始转为“闭源”方向。

 

而且,还有网友发现,Mistral 更改了他们的网站,删除了之前提及的关于他们对开源社区义务的地方,这也让一些人认为 Mistral 已经失去了初心。

 


独立科技记者 Luca Bertuzzi 得到的消息跟《金融时报》完全相反,他发推表示,“与之前的模型不同,Mistral Large 不会开源,换句话说,Mistral 正在放弃其备受赞誉的开源方法。”

 


“他们提供的最初的信息是‘在 2024 年发布开源 GPT-4 级别模型’,现在他们的立场变了,我们不希望他们成为另一个 OpenAI。”

 


模型的定价也引发了一些质疑,比如 Mistral Small 的低延迟相比于 Mixtral 8x7B 的提升微乎其微,但输入贵了 2.8 倍,输出贵了 8.5 倍。

 

那么为什么微软选择和 Mistral 合作?

 

微软在其博客中透露,该公司与 Mistral AI 合作的一个核心方向就是“扩大市场,微软和 Mistral AI 将通过 Azure AI Studio 和 Azure 机器学习模型目录中的模型即服务 (MaaS) 、MACC 服务向客户提供 Mistral AI 的高级模型,提供可替换 OpenAI 模型的多种选择,包括开源和商用模型。”

 

微软表示,其数据中心运行着 1,600 个 AI 模型,其中 1,500 个是开源的。公司希望除了支持 OpenAI 等专有技术之外,继续在这个领域提供支持。

 

而且,训练和开发新的 AI 模型所需的基础设施的建造成本也极高,只有少数几家公司能够参与竞争。

 

微软总裁 Brad Smith 在巴塞罗那举行的世界移动通信大会上表示,微软将致力于一系列旨在鼓励 AI 创新和竞争的原则。他认为,监管机构最终将关注的更广泛问题是,训练和开发 AI 模型的基础设施是否可以广泛应用于没有自己的数据中心和云基础设施的公司。

 

微软与 Mistral 的合作将进一步加剧 AI 领域的竞争。微软、谷歌、亚马逊等科技巨头都在积极布局 AI 领域,并寻求在各自的平台上构建强大的 AI 生态系统。 未来,AI 技术将如何发展,值得我们拭目以待。

 

参考链接:

https://mistral.ai/news/mistral-large/

https://azure.microsoft.com/en-us/blog/microsoft-and-mistral-ai-announce-new-partnership-to-accelerate-ai-innovation-and-introduce-mistral-large-first-on-azure/

https://twitter.com/satyanadella/status/1762165185513722057

 

公众号推荐:

跳进 AI 的奇妙世界,一起探索未来工作的新风貌!想要深入了解 AI 如何成为产业创新的新引擎?好奇哪些城市正成为 AI 人才的新磁场?《中国生成式 AI 开发者洞察 2024》由 InfoQ 研究中心精心打造,为你深度解锁生成式 AI 领域的最新开发者动态。无论你是资深研发者,还是对生成式 AI 充满好奇的新手,这份报告都是你不可错过的知识宝典。欢迎大家扫码关注「AI前线」公众号,回复「开发者洞察」领取。

2024-02-27 14:124506

评论 1 条评论

发布
用户头像
这次微软与法国开源大模型初创公司 Mistral 达成深度合作的消息真是令人振奋!Mistral AI 成立不久就已经估值 20 亿欧元,而且他们推出的最新旗舰模型 Mistral Large 也备受期待。与微软的合作将有助于 Mistral 将其 AI 模型推向市场,并用于开发满足欧洲各国政府和公共部门需求的应用程序。此外,Mistral Large 的推理能力也备受好评,这无疑将为 AI 技术的应用和发展带来新的动力。至于是否会成为“闭源”公司,以及模型定价等问题,我们还需要进一步观察。这次合作将进一步加剧 AI 领域的竞争,未来的发展令人期待。
2024-02-27 14:49 · 北京
回复
没有更多了

大厂offer?拿来吧你!网易有道笔试编程题特辑

有道技术团队

招聘 笔试 #技术干货# 网易有道

“互联网+”大赛之智慧校园赛题攻略:你的智慧校园,WeLink帮你来建

华为云开发者联盟

小程序 华为云 welink 智慧校园 “互联网+”大赛

从0开始的TypeScriptの六:webpack5热更新打包TS

空城机

JavaScript typescript 大前端 8月日更

「免费开源」基于Vue和Quasar的前端SPA项目crudapi后台管理系统实战之EXCEL数据导出(十三)

crudapi

Vue crud crudapi qusar 数据导出

跟我读论文丨ACL2021 NER 模块化交互网络用于命名实体识别

华为云开发者联盟

自然语言处理 机器学习 ACL2021 NER 模块化交互网络 实体识别

B轮融资逾2亿高瓴创投领投,最懂金融的RPA厂商金智维有何不凡之处?

王吉伟频道

RPA 金融科技 机器人流程自动化 做市机器人 金智维

如何评价《Java 并发编程艺术》这本书?

cxuan

书籍推荐 java 并发

手撸二叉树之二叉树的最近公共祖先

HelloWorld杰少

数据结构与算法 8月日更

Go 学习笔记之 反射

架构精进之路

Go 语言 8月日更

Compose 中的 ConstraintLayout

Changing Lin

8月日更

学习笔记:HTTP消息的响应码

姬翔

Spring @Transactional 注解事务

Rubble

springboot 8月日更

Java Array 和 String 的转换

HoneyMoose

解决「停车难」,EMQ 映云科技数据接入方案在智慧停车平台中的应用

EMQ映云科技

大数据 物联网 移动互联网 智慧交通 emq

2021年8月国产数据库排行榜:TiDB稳榜首,达梦返前三,Kingbase进十强,各厂商加速布局云生态

墨天轮

数据库 opengauss TiDB oceanbase 国产数据库

LeetCode题解:783. 二叉搜索树节点最小距离,递归,JavaScript,详细注释

Lee Chen

算法 大前端 LeetCode

Vue进阶(二十八):浅析 Vue 中 computed 与 method 区别

No Silver Bullet

Vue 8月日更 computed

Apache Pulsar 里程碑简史:打造统一消息流平台与生态

Apache Pulsar

Apache Pulsar StreamNative

FastApi-10-Example

Python研究所

FastApi 8月日更

主打年轻群体,2022款欧拉黑/白猫6.98万元起正式预售!

科技热闻

netty系列之:文本聊天室

程序那些事

Java Netty nio 程序那些事

Go协程并发之百万级并发「让我们一起Golang」

Regan Yue

高并发 协程 Go 语言 8月日更

API纠错+翻译,就等您大展身手!

Geek_6cdeb6

云小课 | 网络知识一箩筐——NAT网关,让IP地址华丽变身,轻松实现内外网互通

华为云开发者联盟

私网NAT网关 NAT网关 公网NAT网关

Debian 10 安装 phpMyAdmin

Tao

MySQL 服务器 PHP-FPM MariaDB Debian

【Vue2.x 源码学习】第三十四篇 - 组件部分-Vue组件与初始化流程简介

Brave

源码 vue2 8月日更

4种基于像素分割的文本检测算法

华为云开发者联盟

目标检测算法 文本检测 像素分割 文本检测算法 文本

源码级深挖AQS队列同步器

码农参上

AQS 锁机制 8月日更

3 条掏心掏肺的建议,新手学习编程必备,快上车!

沉默王二

编程

MySQL 系列教程之(一)初识 MySQL

若尘

MySQL 8月日更

【LeetCode】二叉树的镜像Java题解

Albert

算法 LeetCode 8月日更

欧洲版OpenAI被微软收编了,但这家号称专注于“开源”的大模型企业转向了”闭源“?_生成式 AI_Tina_InfoQ精选文章