写点什么

英特尔实现光子神经网络新突破,有效提升光子芯片效率

  • 2019-05-22
  • 本文字数:1403 字

    阅读完需:约 5 分钟

英特尔实现光子神经网络新突破,有效提升光子芯片效率

构成光线的光子表现得很聪明:在所有可能的曲线中,它们总是选择能够最快地达到目标的光子。

——马克斯·普朗克


光子集成电路或光学芯片比电子电路或芯片更具优势,包括降低功耗和延迟。这就是为什么研究人员认为光子设备可能会为人工智能工作带来巨大进步。


Max Welling 在 2018 年 ICML 大会上的主题演讲很好地描述了“每千瓦时智能”的概念,强调了人工智能高效计算的必要性;而在延迟这个话题上,人工智能从业者敏锐地意识到,在交通等对安全要求甚高的实时应用程序中,更快的反应时间将直接转化为更高的安全性。


两年前,麻省理工学院的 Shen Yichen 博士等人进行了一项开创性的研究,提出了一条既能降低延迟又能提高能源效率的途径:光神经网络(ONNs)。在上周的克莱奥会议上,英特尔及其合作者在加州大学伯克利分校提出有关 ONNs 的新发现,包括建议如何扩展原始工作面对现实制造约束,将纳米光子神经网络电路实际现实更近一步。


长期以来,光子一直对硬件设计师具有强大的吸引力,因为它们可以快速、轻松地穿过物质。硅可以作为一种光学介质,这意味着可以利用几十年的芯片制造技术来构建光的电路。这种被称为硅光子学的技术,在通信和计算领域开辟了巨大的可能性。


Shen Yichen 论文的一个关键贡献是实验证明了:光子电路的一个共同组成部分,称为马赫-曾德尔推断器(Mach-Zehnder inferometer,简称 MZI),可以配置成在与两束光的相位相关的量之间执行 2×2 矩阵乘法;此外,他们实现了将这些小矩阵乘法安排在一个三角形网格中,以创建更大的矩阵。最终的结果是一个实现矩阵-向量乘法的光子电路,这是深度学习中的核心计算。


任何制造过程中都存在缺陷,这意味着芯片内部和芯片之间会有小的变化,这些都会影响计算的准确性。为了使 ONNs 更接近生产,研究人员想了解它们对典型的过程变化有多敏感,特别是当它们扩展到更现实的问题大小时,是否可以通过考虑不同的电路结构使它们对这些变化更加健壮。


在最近发表的一篇论文中,英特尔的研究者们考虑了用 MZIs 构建光学神经网络引擎的两种架构:一种称之为 GridNet,该方法将 MZIs 排列在一个网格中;另一种方法被称之为 FFTNet,它将 MZIs 按照计算快速傅里叶变换的体系结构(但在案例中,权重是从数据中学习的,所以通常计算不会是实际的 FFT)建模,形成蝴蝶状的模式。


然后,研究人员在一个针对手写数字识别(MNIST)基准深度学习任务的软件仿真中对这两种体系结构进行了训练。结果发现:在双精度浮点精度的情况下,GridNet 的精度要高于 FFTNet (~98% vs ~95%),而 FFTNet 对制造的不精确性有更强的鲁棒性。同时,研究者们进一步发现,通过在每个 MZI 的移相量和透射率中添加噪声来模拟,将这些噪声水平设置为现实水平后,GridNet 的性能下降到 50%以下,而 FFTNet 的性能几乎保持不变。


如果 ONNs 要成为人工智能硬件生态系统中一个可行的部分,它们需要扩展到更大的电路和工业制造技术。英特尔的发现解决了这两个问题:更大的电路将需要更多的设备,因此,试图在芯片制造后对每个设备进行“微调”将是越来越大的挑战。


英特尔认为,一个更具可扩展性的策略是在软件中培训 ONNs,然后根据这些参数批量生产电路。实验结果表明,提前选择正确的架构可以极大地增加产生的电路即使在制造变化的情况下也能达到预期性能的可能性。


有科学家表示,英特尔的这项研究为人工智能软件训练技术奠定了基础,可以避免在制造后微调光学芯片的需要,从而节省宝贵的时间和人力。


2019-05-22 17:2115449
用户头像
陈思 InfoQ编辑

发布了 576 篇内容, 共 299.5 次阅读, 收获喜欢 1306 次。

关注

评论

发布
暂无评论
发现更多内容

探索虚拟线程:原理与实现

京东科技开发者

软件测试学习笔记丨Pytest - 测试框架介绍(setup / teardown)

测试人

软件测试

人工智能 | 大模型之提示词工程:少样本提示

测试人

软件测试

mac鼠标自动点击工具:RapidClick for Mac 激活版

你的猪会飞吗

Mac 软件 mac破解软件下载 Mac电脑软件

凤凰项目(Phoenix Project)精要 - 简介

Anliven

读书笔记 团队管理 DevOps 运维 团队效能

【论文速读】|利用大语言模型实现现实世界代码的翻译:一项针对翻译到Rust语言的研究

云起无垠

Claude 3.5 Sonnet发布,比GPT-4o更智能;OpenAI CTO预测1年半“博士级智能”AI将出现|AI日报

可信AI进展

#人工智能

直播分享:企业级AI应用玩转全栈开发

XIAOJUSURVEY

开源 全栈 直播 LLM

亮相WOT全球技术创新大会,揭秘火山引擎边缘容器技术在泛CDN场景的应用与实践

火山引擎边缘云

CDN 边缘计算 边缘容器 CDN技术 边缘计算平台

实力出圈!赛博威荣获双项殊荣,数字化能力再获认可

赛博威科技

美丽搜索,MeiliSearch

为自己带盐

meilisearch

山寨币大额解锁抛压拖累比特币:10X Research 深度剖析市场动荡

区块链软件开发推广运营

dapp开发 区块链开发 链游开发 NFT开发 公链开发

传媒行业指哪些?需要过等保吗?

行云管家

等保 等级保护 等保测评 传媒

警告!恶意域名疯狂外联,原因竟然是……

权说安全

应急响应 安全服务

Toco x Databend:Databend Cloud 如何满足 Web3 大数据服务的严苛考验?

Databend

Moka Ascend 2024|势在·人为,技术创新,激发企业管理内在效能

科技汇

玩转Spring状态机

京东科技开发者

分库分表后复杂查询的应对之道:基于DTS实时性ES宽表构建技术实践

京东科技开发者

【HDC 2024】探索、交流、成长,华为云助力开发者成就星辰大海梦想

华为云开发者联盟

软件开发 华为云 华为云开发者联盟 华为开发者大会2024 企业号2024年6月PK榜

TDengine 签约精诚瑞宝,开拓更智能的 IT 服务和管理平台

TDengine

数据库 tdengine 时序数据库

智能化改造助力企业高质量发展

天津汇柏科技有限公司

智能化 高质量发展

英特尔实现光子神经网络新突破,有效提升光子芯片效率_AI&大模型_陈思_InfoQ精选文章