今天,微软突然宣布与法国开源大模型初创公司 Mistral 达成深度合作。
Mistral AI 正式成立于 2023 年 5 月,估值 20 亿欧元(约合 21 亿美元)。双方将共同开展研发合作,并将 Mistral 的 AI 模型部署在微软 Azure 云计算平台上。这将使 Mistral 成为继 OpenAI 之后,第二家在 Azure 上提供商用语言模型的公司。
而且,据媒体透露,作为交易的一部分,微软还将对 Mistral 进行投资。这将使其成为继 OpenAI 之后,微软投资的第二家 AI 大模型公司。具体投资金额尚未披露。此前,微软投资 OpenAI 为 130 亿美元,持有 OpenAI 约 49%股份。
AI 新贵 Mistral 发布最新旗舰大模型
Mistral AI 也于今天宣布正式推出最新旗舰模型 Mistral Large。这是一种新的语言模型,旨在与 OpenAI 的 GPT-4 直接竞争。
Mistral AI 声称该模型具有“顶级的推理能力”,能用于处理复杂的多语言推理任务,包括文本理解、转换和代码生成。
在常用基准测试 MMLU 的对比中,Mistral Large 的得分仅次于 GPT-4,略好于 Anthropic 开发的 Claude 2。至于谷歌的 Gemini Pro 以及的 LLaMA 2 70B 模型,则被甩开了一个身位。
在推理能力上,Mistral Large 也仅次于 GPT-4,优于 LLaMA 2 70B 模型:
Mistral Large 具有本地多语言能力。它在法语、德语、西班牙语和意大利语的 HellaSwag、Arc Challenge 和 MMLU 基准测试中明显优于 LLaMA 2 70B。
各路网友纷纷对其进行了测试,表示其能力“仅次于 OpenAI”、“中文文本处理能力无限逼近 GPT-4”......
Mistral AI 在发布大模型的博客中,同时宣布将他们的开放式和商业模型引入到 Azure 中。所以现在访问 Mistral AI 的模型方式为:
La Plateforme:该平台托管在 Mistral 位于欧洲的基础设施上,使开发人员能够利用 Mistral AI 全系列模型构建应用程序和服务。
Azure:Mistral Large 已通过 Azure AI Studio 和 Azure Machine Learning 上线,用户体验顺畅,一些测试版客户已经在使用。
自部署:对于最敏感的用例,用户可以在自己的环境中部署 Mistral AI 的模型,并访问其模型权重。
微软表示与 Mistral 的合作将帮助 Mistral 将其 AI 模型推向市场,并用于开发满足欧洲各国政府和公共部门需求的应用程序。
微软总裁 Brad Smith 发言称,微软与 Mistral 的合作,将推动 AI 技术在欧洲乃至全球的应用和发展。他认为,AI 将创造全新的业务和商业模式,并将对各个行业产生深远影响。
这次合作,让 Mistral 成为“闭源”公司?
微软首席执行官萨特亚·纳德拉 (Satya Nadella) 近日称赞了法国初创公司 Mistral AI,将其视为在 Azure 云计算平台上构建人工智能的创新者之一。
Mistral 由三位来自 Meta 和谷歌的前研究人员 Mensch、Timothée Lacroix 和 Guillaume Lample 创立,致力于构建大语言模型,这也是生成式 AI 产品的基础技术。
Mistral 于去年 12 月的融资中获得了 20 亿欧元的估值,融资金额约为 4 亿欧元。
据英国《金融时报》,该公司承诺将模型开源,这意味着技术细节将公开发布,这与竞争对手 (例如 ChatGPT 制造商 OpenAI) 的做法形成鲜明对比。OpenAI 最新的模型 GPT-4 是所谓的 “黑匣子”,用于构建模型的数据和代码不会提供给第三方。
Mistral 此前也一直专注于开源 AI 软件,他们坚信生成式 AI 技术应该是开源的,允许自由复制和修改 LLM 代码,通过这种方式帮助其他用户快速构建自己的聊天机器人。Mixtral 8x7b 则被许多人视为目前性能最好的开源 LLM。
但因为 Mistral 没有像往常一样提供 GitHub 或是下载链接,不少网友担心这家公司开始转为“闭源”方向。
而且,还有网友发现,Mistral 更改了他们的网站,删除了之前提及的关于他们对开源社区义务的地方,这也让一些人认为 Mistral 已经失去了初心。
独立科技记者 Luca Bertuzzi 得到的消息跟《金融时报》完全相反,他发推表示,“与之前的模型不同,Mistral Large 不会开源,换句话说,Mistral 正在放弃其备受赞誉的开源方法。”
“他们提供的最初的信息是‘在 2024 年发布开源 GPT-4 级别模型’,现在他们的立场变了,我们不希望他们成为另一个 OpenAI。”
模型的定价也引发了一些质疑,比如 Mistral Small 的低延迟相比于 Mixtral 8x7B 的提升微乎其微,但输入贵了 2.8 倍,输出贵了 8.5 倍。
那么为什么微软选择和 Mistral 合作?
微软在其博客中透露,该公司与 Mistral AI 合作的一个核心方向就是“扩大市场,微软和 Mistral AI 将通过 Azure AI Studio 和 Azure 机器学习模型目录中的模型即服务 (MaaS) 、MACC 服务向客户提供 Mistral AI 的高级模型,提供可替换 OpenAI 模型的多种选择,包括开源和商用模型。”
微软表示,其数据中心运行着 1,600 个 AI 模型,其中 1,500 个是开源的。公司希望除了支持 OpenAI 等专有技术之外,继续在这个领域提供支持。
而且,训练和开发新的 AI 模型所需的基础设施的建造成本也极高,只有少数几家公司能够参与竞争。
微软总裁 Brad Smith 在巴塞罗那举行的世界移动通信大会上表示,微软将致力于一系列旨在鼓励 AI 创新和竞争的原则。他认为,监管机构最终将关注的更广泛问题是,训练和开发 AI 模型的基础设施是否可以广泛应用于没有自己的数据中心和云基础设施的公司。
微软与 Mistral 的合作将进一步加剧 AI 领域的竞争。微软、谷歌、亚马逊等科技巨头都在积极布局 AI 领域,并寻求在各自的平台上构建强大的 AI 生态系统。 未来,AI 技术将如何发展,值得我们拭目以待。
参考链接:
https://mistral.ai/news/mistral-large/
https://twitter.com/satyanadella/status/1762165185513722057
公众号推荐:
跳进 AI 的奇妙世界,一起探索未来工作的新风貌!想要深入了解 AI 如何成为产业创新的新引擎?好奇哪些城市正成为 AI 人才的新磁场?《中国生成式 AI 开发者洞察 2024》由 InfoQ 研究中心精心打造,为你深度解锁生成式 AI 领域的最新开发者动态。无论你是资深研发者,还是对生成式 AI 充满好奇的新手,这份报告都是你不可错过的知识宝典。欢迎大家扫码关注「AI前线」公众号,回复「开发者洞察」领取。
评论 1 条评论