
北京时间 5 月 22 日凌晨,外界期待已久的微软 Build 开发者大会在美国西雅图开幕。微软 CEO 萨蒂亚·纳德拉 (Satya Nadella) 登台官宣一系列新品发布,并讲述了人工智能时代将如何释放新机遇、改变开发人员的工作方式并提高各行业的业务生产力。
今天的微软 Build 大会上,微软发布了一系列 AI 全家桶以及众多开发者工具,其中较为亮眼的要属 Phi-3 小模型家族中的一系列产品。
纳德拉称已经在 Huggingface 上发布了 Phi-3-medium,Phi-3-small,以及 Phi-3-vision 系列模型。其中 Phi-3-medium-128k-instruct 成为目前消费级硬件上可用的最好的模型。
据介绍,Phi-3-vision 仅 4.2B 参数。Phi-3-vision 是其 Phi-3 系列人工智能小语言模型 (SLM) 的最新成员,目前正在预览中。 Phi-3 型号专为个人设备量身定制,将强大功能与成本效益融为一体。 Phi-3-Vision 拥有 42 亿个参数,能够处理各种视觉推理任务,包括图表、图形和表格的分析。它使用户能够输入图像和文本,生成基于文本的响应。

此外,之前发布的 Phi-3-small 和 Phi-3-medium 现已在 Microsoft Azure 上推出,为开发人员提供需要强大推理、有限计算和延迟限制场景的生成式 AI 应用程序模型。此外,之前提供的 Phi-3-mini 和 Phi-3-medium 现在也可以通过 Azure AI 的模型即服务产品提供,使用户能够快速轻松地开始使用。
Phi-3 小 128k 开源地址:https://huggingface.co/microsoft/Phi-3-small-128k-instruct
Phi-3-medium 128k 开源地址:https://huggingface.co/microsoft/Phi-3-medium-128k-instruct
Phi-3-small 8k 开源地址:https://huggingface.co/microsoft/Phi-3-small-8k-instruct
Phi-3-medium 4k 开源地址:https://huggingface.co/microsoft/Phi-3-medium-4k-instruct
此系列的所有模型的 License 均为 MIT,相对 Llama-3 的 License 更友好。Phi-3-medium 参数量为 14B,包含 4K 和 128K 两个版本。用了 512 块 H100,在 4.8T 块上训练了 42 天。
值得注意的是,该系列小模型在代码和数学能力方面有巨大的提升,整体性能与 Mixtral 8x22B, Llama 3 70-instruct 接近,超过 Command R+ 104B 和 GPT 3.5。
Copilot 进一步融入全家桶
Satya Nadella 在 Build 2024 大会开幕式上讨论了新的 AI 时代。他表示,微软几十年来一直有两个梦想:
1)计算机可以理解我们而不是我们必须理解计算机吗?
2)在这个信息不断增加的世界里,计算机能否帮助我们根据所有这些信息进行推理、规划和更有效地采取行动?
纳德拉将这波人工智能浪潮定位为微软梦想的答案。
微软使用 Copilot 一词来指代生成式 AI,在过去九个月的时间里,微软产品组合中已经有大约 135 个 Copilot surfaces,他们对人工智能的热情都表现在 Copilot 上了。

Copilot 之于 AI 就像 Win32 之于图形用户界面
“就像 Win32 之于图形用户界面一样,我们相信 Windows Copilot 运行时将用于 AI — 它从我们的 Windows Copilot 库开始,这是这些即用型本地 API 的集合,可帮助您将所有我们昨天分享了人工智能功能。” Satya Nadella 将此比作 Win32 等重大时刻,让开发人员能够更轻松地将 AI 构建到他们的 Windows 应用程序中。

GitHub Copilot 是 Microsoft 生成式 AI 的首批重要产品之一,目前拥有 180 万付费用户。

GitHub 推出首套由微软和第三方合作伙伴开发的 GitHub Copilot 扩展,现已开启受邀预览。新增功能允许开发者、企业通过其偏好的服务(如 Azure、Docker、Sentry 等)直接在 GitHub Copilot Chat 中定制其 GitHub Copilot 智能体验。
作为微软推出的扩展功能之一,GitHub Copilot for Azure 展示了如何利用自然语言和更广泛的功能来提高开发速度。通过 Copilot Chat 使用该扩展,开发者可以探索和管理 Azure 资源,同时排除故障、查找相关日志和代码。

Microsoft 宣布推出 Team Copilot,这是 Microsoft 365 中 Copilot 功能的重大演变。
从个人 AI 助理转变为不可或缺的团队助理,Team Copilot 将可以跨各种协作平台(例如 Teams、Loop 和 Planner)进行访问。这一增强功能使 Team Copilot 能够扮演多种角色:会议主持人,管理议程、跟踪会议时间和记录会议内容;聊天中的协作者识别关键信息、跟踪任务和解决问题;项目经理确保项目效率并促进团队贡献。
这些初始功能将于今年晚些时候提供预览,标志着新的创新阶段的开始,Team Copilot 越来越多地代表个人和团队行事。

Microsoft Copilot Studio 正在推出高级 agent 功能,使开发人员能够创建能够自主对数据和事件做出反应的 Copilot,并针对不同的任务和角色进行定制。这些增强的功能使 Copilot 能够利用记忆和背景知识,对行动和输入做出合理的决策,根据用户反馈进行调整,并在面临不熟悉的挑战时寻求帮助,从而自主监督复杂的、持续的业务运营。
这项创新意味着用户现在可以在各个领域部署 Copilot :从管理 IT 设备采购流程到充当销售和服务领域的客服。

纳德拉还宣布将通过 Windows DirectML 提供对 PyTorch、WebNN 框架的原生支持,这将为开发人员提供更多可用的工具。处理器的 NPU 应该可以帮助这些工具比以往更快地执行。

随后,纳德拉谈到了人工智能基础设施。
他称,Azure 在 60 多个地区可用。该公司已将其扩展到比以往更多的地区,并承诺提供可持续的云服务。有些内容对于普通人来说可能有点难以理解。但简而言之,如果开发人员能够创建让生活更轻松的应用程序,那么我们所有人都将获益。
奥特曼压轴登场,要让大模型更便宜
在微软官宣了一系列更新后,OpenAI CEO 奥特曼也来到了活动现场以示支持。他鼓励开发者和初创公司利用当前的人工智能热潮,认为这是自移动设备繁荣甚至互联网出现以来最令人兴奋的时刻。

在模型方面,奥特曼透露,未来,GPT-4o 将变得更快,但更便宜。
他还预告下一个大模型即将问世,而且微软为这项工作建造了一台更大的超级计算机(如同虎鲸一样规模的超算)。

奥特曼暗示,新的模态和整体智能将是 OpenAI 下一个模型的关键。
“最重要的一点,听起来也是我能说的最无聊的一点...... 模型会变得越来越智能,总的来说是全面智能。”
评论