深度物理神经网络

2022-10-09  本文已影响0人  可能性之兽

这个脑洞真的惊艳到我了,宇宙就是最大的计算器吗
Deep physical neural networks trained with backpropagation | Nature

深度学习模型已经成为科学和工程领域的普遍工具。然而,它们的能源需求现在越来越限制了它们的可伸缩性。深度学习加速器旨在有效地执行深度学习能量,通常针对推理阶段,并经常利用传统电子学之外的物理基板。迄今为止的方法已经不能应用反向传播算法在原位训练非常规的新型硬件。反向传播的优点使其成为大规模神经网络事实上的训练方法,这种不足构成了一个主要的障碍。在这里,我们介绍了一种称为物理感知训练的混合原位计算机算法,它将反向传播应用于训练可控物理系统。正如深度学习实现由数学函数层构成的深度神经网络的计算一样,我们的方法允许我们训练由可控物理系统层构成的深度物理神经网络,即使物理层与传统的人工神经网络层缺乏任何数学同构性。为了证明我们的方法的普遍性,我们训练不同的物理神经网络基于光学,力学和电子学,以实验执行音频和图像分类任务。物理感知训练结合了反向传播的可扩展性和原位算法可实现的缺陷和噪声的自动缓解。物理神经网络具有比传统电子处理器更快和更有效地执行机器学习的潜力,并且更广泛地说,可以赋予物理系统自动设计的物理功能,例如机器人,材料和智能传感器。

在这里,我们演示了一个通用的框架,使用反向传播直接训练任意物理系统来执行 DNN,即 PNN。我们的方法是通过一种称为物理感知训练(PAT)的混合原位计算机算法实现的。PAT 允许我们在任何物理输入输出转换序列上高效准确地执行反向传播算法。我们通过实验证明了这种方法的普遍性,使用三种不同的系统进行图像分类: 驱动金属板的多模机械振荡,非线性电子振荡器的模拟动力学和超快光学二次谐波生成(SHG)。我们获得准确的分级分类器,利用每个系统的独特的物理变换,并内在地减轻每个系统的独特的噪声过程和缺陷。尽管 PNN 与传统硬件有很大的不同,但是很容易将它们集成到现代机器学习中。我们表明,PNN 可以通过物理-数字混合结构与传统的硬件和神经网络方法无缝结合,在这种结构中,传统的硬件学习使用 PAT 与非传统的物理资源进行机会合作。最终,PNN 为许多数量级提供了提高机器学习能源效率和速度的途径,以及自动设计复杂功能设备的途径,如功能性纳米粒子,机器人和智能传感器。

上一篇 下一篇

猜你喜欢

热点阅读