转译:麻省理工学院和IBM发现智能AI策略,避开传统繁复计算。这项技术有望显著降低AI训练所需的数据量。
自牛顿的时代以来,我们认识到自然界的基本法则可以通过一组关键而广泛的方程来描述。现在,研究人员发现了利用受大脑启发的神经网络来更高效地解决这些方程的新方法,这一发现在科学和工程的许多领域都有潜在的应用价值。
在现代科学和工程领域,偏微分方程是用来建模那些涉及多个变化速率的复杂物理系统的工具,比如同时跨越空间和时间变化的系统。它们能够模拟诸如飞机翼周围气流的流动、空气中污染物的扩散或是恒星坍缩成黑洞等多种现象。
传统上,科学家们通过使用高精度数值方法来解决这类复杂方程,但这些方法通常既耗时又需要大量的计算资源。
目前,我们有了一种更简便的选择,即所谓的数据驱动替代模型。这类模型,包括神经网络,在接受数值求解方法生成的数据训练后,能够预测其可能的输出结果。然而,这些模型仍然需要大量的数值求解数据进行训练,随着模型大小的增加,所需的数据量呈指数级增长,这使得该策略难以扩展,佐治亚理工学院的计算科学家拉斐尔·佩斯托里指出。
在一项新研究中,研究人员提出了一种开发替代模型的新策略。这种策略利用物理模拟器来训练神经网络,以便它们能够匹配高精度数值系统的输出。其目标是利用领域内的专家知识——本例中是物理学——来生成准确结果,而不是单纯依赖大量计算资源来暴力求解问题。
通过实验,研究人员探索了他们称之为物理增强深度替代模型(PEDS)在三种物理系统上的应用,包括扩散(如染料在液体中的扩散)、反应-扩散(如化学反应后的扩散过程)和电磁散射。
这项研究表明,这些新模型在解决偏微分方程问题时的准确度可比其他神经网络高出三倍,而且这些模型只需要大约1000个训练点。这至少将达到5%目标误差所需的训练数据量减少了100倍。
佩斯托里表示:“这个想法很直观——让神经网络负责学习,让科学模型处理科学问题。PEDS的实践表明,将两者结合起来的效果远超各自单独的效能。”
PEDS模型的潜在应用前景广泛,包括加速模拟工程中随处可见的复杂系统,如天气预报、碳捕获技术和核反应堆等。
该项研究成果已在《自然机器智能(Nature Machine Intelligence)》杂志上发表。
https://t.co/hATkLXAByp
点击图片查看原图
点击图片查看原图