写点什么

Big Sur:Facebook 的开源机器学习硬件

  • 2015-12-20
  • 本文字数:1088 字

    阅读完需:约 4 分钟

作为人工智能(Artificial Interlligence,AI)领域,尤其是机器学习方向的领头企业,Facebook 在机器学习算法方面进行了很多研究,公布并开源了很多相关的成果。近日,Facebook 又公布了其下一代的“Big Sur”人工智能硬件框架的信息,并表示将开源其设计细节。

近些年,人工智能和机器学习方向取得了长足的发展。据 Kevin Lee 透露,Facebook 的 AI 软件已经能够阅读故事、回答相关场景的问题玩游戏以及通过一些例子来学习非指定的内容。作为计算密集型的应用,AI 软件的性能与数据集规模/ 硬件性能密切相关。尤其是硬件方面,高性能微处理器、存储器以及图形处理器(Graphics Processing Unit,GPU)的发展为AI 算法的快速运行提供了坚实基础。为了进一步更好地服务大规模AI 计算,Facebook 推出了基于GPU 的、用于训练神经网络的“Big Sur”硬件系统。

如上图所示,该硬件系统提供了8 个PCI-e 插槽,最多可支持8 个高性能GPU,其中每个GPU 的最高功耗可达300W。而且,系统可以根据需要对GPU 的拓扑进行灵活配置。Kevin 表示,配备 NVIDIA Tesla M40 加速计算平台的 Big Sur 系统性能,比上一代系统要提高一倍——训练速度是原来的两倍,探索网络的规模也可达到原来的两倍。而且,Big Sur 系统具有更高的灵活性和功耗 / 制冷效率。Facebook 特别针对功耗和散热进行了优化,使得系统仍然可以使用风扇进行散热。

此外,系统进一步优化了系统维护相关的资源。Big Sur 已经移除了一些很少使用的组件,并提升了替换硬盘和内存等易损组件的便捷性,使得替换这些组件只需要几秒钟时间即可。而且,原来需要耗费一个小时的移除主板的工作也可在一分钟内完成。除了处理器的散热片以外,该系统基本可以做到免工具安装和移除。在触点的颜色方面,Big Sur 系统选用了 Facebook 一贯使用的 Pantone 375 C 的绿色,方便工程师设别、访问和移除组件。

Kevin 表示,Facebook 将会延续之前的做法开源 Big Sur 系统的设计,并将设计材料提交到开源计算项目。据预测,此项工作的对外发布可能会在明年的OCP 峰会上进行。Facebook 希望通过这种做法,既为社区做出贡献,又能够与社区合作改进该系统。此外,Facebook 的AI 研究团队的 Yann LeCun 表示,如果更多的企业采用 Big sur 的设计,该系统的价格也可以随着供货量提升而大幅度下降,从而减少企业的硬件成本。


感谢董志南对本文的审校。

给InfoQ 中文站投稿或者参与内容翻译工作,请邮件至 editors@cn.infoq.com 。也欢迎大家通过新浪微博( @InfoQ @丁晓昀),微信(微信号: InfoQChina )关注我们,并与我们的编辑和其他读者朋友交流(欢迎加入 InfoQ 读者交流群(已满),InfoQ 读者交流群(#2))。

2015-12-20 18:003389
用户头像

发布了 268 篇内容, 共 124.9 次阅读, 收获喜欢 24 次。

关注

评论

发布
暂无评论
发现更多内容

VMware ESXi 7.0U3r Unlocker & OEM BIOS 标准版和厂商定制版

sysin

esxi

“全球金牌敏捷课程” · 12月28-29日CSM认证课程 · Jim老师引导讨论AI & Agility话题

ShineScrum

VMware Workstation 17.6.2 Pro Unlocker & OEM BIOS 2.7 for Windows & Linux

sysin

Workstation

鸿蒙应用开发从入门到入行 - 篇3:ArkUI布局基础与制作可交互页面

猫林老师

鸿蒙 HarmonyOS 鸿蒙应用开发 鸿蒙原生应用开发 HarmonyOS NEXT

Splunk Enterprise 9.4 发布,新增功能概览

sysin

Splunk Enterprise

VMware Fusion 13.6.2 OEM BIOS 2.7

sysin

VMware Fusion 虚拟机

鸿蒙+next+实现知识点列表的重复布局

flfljh

鸿蒙JSON对象里面的Map类型的数据如何接收

flfljh

深度学习的下一站:解锁人工智能的新边界

天津汇柏科技有限公司

深度学习 AI 人工智能

反向海淘与反向代购的盈利之道及代购系统建站挑战

代码忍者

代购系统 跨境独立站

鸿蒙开发:前端页面调用 ArkTS 函数全解析

flfljh

鸿蒙next中Web的使用

flfljh

Ascend Extension for PyTorch是个what?

zjun

PyTorch CANN Ascend

鸿蒙+next+实现试卷计时器

flfljh

鸿蒙Flutter性能调优之滑动响应时延

flfljh

鸿蒙应用开发从入门到入行 - 篇7:http网络请求

猫林老师

鸿蒙 HarmonyOS 鸿蒙应用开发 鸿蒙原生应用开发 HarmonyOS NEXT

鸿蒙+next实现页签栏平板端适配

flfljh

鸿蒙Flutter性能调优分析之帧渲染跟踪

flfljh

第78期 | GPTSecurity周报

云起无垠

VMware ESXi 7.0U3r Unlocker & OEM BIOS 集成网卡驱动和 NVMe 驱动 (集成驱动版)

sysin

esxi

鸿蒙ArkWeb 跨域请求

flfljh

安全架构师的自我修炼:从原则到实践

I

安全架构师 信息安全 安全设计 企业安全 安全架构设计

Ascend Extension for PyTorch的源码解析

zjun

模型 PyTorch Ascend

鸿蒙应用开发从入门到入行 - 篇6:数据监听器、滚动、侧滑功能

猫林老师

鸿蒙 HarmonyOS 鸿蒙应用开发 鸿蒙原生应用开发 HarmonyOS NEXT

鸿蒙Flutter之解析flutter相关的cppcrash堆栈

flfljh

《Django 5 By Example》阅读笔记:p614-p644

codists

Python django

Ascend上的FlashAttention实现

zjun

Transformer 大模型 Ascend

SelfAttention在Ascend上的实现

zjun

Transformer 大模型 Ascend

Ascend上的PageAttention

zjun

大模型 Ascend PagedAttention

鸿蒙+next+使用并封装EmitterUtil

flfljh

msprofiler前置知识:如何看懂tracing profile文件?

zjun

性能 debug Trace

Big Sur:Facebook的开源机器学习硬件_Meta_张天雷_InfoQ精选文章