苹果公司开源机器学习框架MLX，针对Silicon芯片进行了优化_芯片&算力



 写点什么



大小：571.58K时长：03:15

苹果公司的机器学习框架MLX结合了开发者熟悉的 API、可组合的函数转换和惰性计算，部分灵感源于 NumPy 和 PyTorch，并针对苹果的 Silicon 进行了优化。该框架使用 Python 和 C++实现，旨在为在苹果 Silicon 上训练和部署机器学习模型提供用户友好且高效的解决方案。

根据苹果公司的说法，MLX 是由机器学习研究人员为机器学习研究人员设计的，并基于 MIT 发布许可，可以很容易地被扩展和改进。它支持转换语言模型训练、使用 Mistral 进行大规模文本生成、使用 Stable Diffusion 进行图像生成以及使用 Whisper 进行语音识别。

MLX 提供了受 NumPy 启发的底层 Python API 和一个完整的与之密切对应的 C++ API。此外，它还提供了一个高级 API，可用于根据 PyTorch API 创建更复杂的模型。

该框架支持自动微分、自动向量化和计算图优化，可组合的函数使得构建复杂数组转换变得更加容易。MLX 还支持惰性计算，这意味着它可以只在必要时才计算数组，以提高计算效率。同样，计算图是动态构建的，因此修改函数参数并不会触发缓慢的编译过程。

MLX 的一个独有的特性是使用了苹果 Silicon 的统一内存，这让它有别于其他的 ML 框架。这意味着数组位于共享内存中，可以在 CPU 或 GPU 上执行数组操作，无需在内存之间传输数据。例如，在创建一个数组时，你不需要指定位置，因为它位于统一内存中，而在执行操作时可以选择在 CPU 或 GPU 上执行转换：

a = mx.random.normal((100,))
b = mx.random.normal((100,))
mx.add(a, b, stream=mx.cpu)
mx.add(a, b, stream=mx.gpu)

复制代码

MLX 可在任意的苹果 Silicon CPU 上运行，包括 M1，并可以利用集成的 GPU，因此研究人员可以选择最适合其需求的硬件。

MLX 的代码库中包含了一些针对不同模型的示例，包括 BERT、Llama、Mistral、Stable Diffusion 等。每个示例都在requirements.txt文件中列出所需的依赖项，并提供了现成的 CLI 工具。例如，要使用 Stable Diffusion 生成图像，首先安装所有必需的依赖项，然后运行txt2image.py命令：

pip install -r requirements.txt

python txt2image.py "A photo of an astronaut riding a horse on Mars." --n_images 4 --n_rows 2

苹果尚未公开发布基准测试，因此我们目前不知道它与PyTorch/MPS或 Georgi Gerganov 的Llama.cpp相比表现如何。

不过，Stable Diffusion 示例中包含了使用 PyTorch 和 MLX 运行 UNet 的性能比较。MLX 在批次大小为 16 时的吞吐量比 PyTorch 高约 40%，最佳批次大小大 15%左右。

然而，PyTorch 在较小的批次大小时表现更好，批次大小为 1 时吞吐量高约 50%，批次大小为 4 时高约 10%。根据苹果公司的说法，PyTorch 在这些情况下的优势要归因于在模型还没有被加载到内存中且 PyTorch 的 MPS 图内核未被缓存时的编译速度。

如果你有兴趣体验 MLX，请参阅其快速入门指南或完整文档。

原文链接：

https://www.infoq.com/news/2023/12/apple-silicon-machine-learning/

发布

暂无评论

创作场景

苹果公司开源机器学习框架 MLX，针对 Silicon 芯片进行了优化

评论

「Macos最新」XMind for mac v24.01中文版

华为云康宁：携手伙伴，基于核心技术构筑健康可持续新生态

鑫裕集团：引领建筑行业创新，开启数智化转型新篇章

2.5A、3MHz开关充电器解决方案

10m带宽香港服务器的优势

微信多开插件：WeChatHooks for mac

GreatSQL社区与Amazon、Facebook、Tencent共同被MySQL致谢

边缘计算平台如何助力元宇宙实现？

第六期 |《实时洞察智能运营一用友企业绩效管理白皮书》解读

面试官：网关如何实现限流？

低代码平台技术分享官 | 漫话iGIX前端设计模式

从热爱到深耕，全国Top10开源软件出品人探索“开源云上行”

MacBook触控板窗口管理推荐 Swish免激活最新

物联专栏丨云边协同技术加速AloT能力向边缘侧快速演进

CnosDB有主复制演进历程

向量数据库—加速大模型训练推理

第9期 | 用友BIP项目云，助力企业投资类项目管理降本增收

专家观点：基于数智化GOT模型的流程制造业绩效管理

探索容灾架构演进之路-从单点到异地多活

开发者的福利-Amazon CodeWhisperer

app小程序定制开发的优势

光纤的跳线和尾纤

打造数字经济全新引擎，用友iuap构建实体经济数智底座

企业网站快速搭建的重点|软件定制app小程序建设

Kubernetes Gateway API 攻略：解锁集群流量服务新维度！

龙蜥社区召开理事闭门会，讨论多项社区规划

Embedding技术与应用(4): Embedding应用工程探析

创作场景

苹果公司开源机器学习框架 MLX，针对 Silicon 芯片进行了优化

评论

更多内容推荐

推荐阅读

电子书

大厂实战PPT下载