快多个数量级,清华更高精度、更泛化的深度学习电子结构计算方法

孤岚和科技 2024-10-13 18:45:26

两年前,清华大学物理系徐勇、段文晖研究组开发出高效精确的第一性原理电子结构深度学习方法DeePH,可极大加速电子结构计算。近日,该团队开发了一种准确而有效的实空间重构方法(real-space reconstruction),将DeepH方法从原先仅支持原子基组推广至适用于平面波基组,使得DeepH方法可与所有密度泛函理论(DFT)程序兼容。而且,该重构方法比传统的基于投影的方法快几个数量级。这给深度学习电子结构计算方法带来了更高的精度和更好的泛化能力,并打通了其利用电子结构大数据作深度学习的通道。相关研究以「Generalizing deep learning electronic structure calculation to the plane-wave basis」为题,于10月3日发布在Nature Computational Science上。

DeepH成功与局限性

近年来,从头计算与AI相结合取得了显著进展。这大大扩展了理论和计算材料研究的范围,达到了前所未有的精度和效率。

深度学习方法DeepH取得了巨大的成功,在比传统DFT方法快多个数量级的速度下仍能保持亚毫电子伏的精度。

然而,此类方法只支持局域原子轨道 (AO) 基组下的DFT程序,而完全不兼容使用平面波 (PW)基组的DFT程序。事实上,平面波基组相对原子轨道基组有其独特的优势,如容易收敛、精度高、应用更广泛等,因此将DeepH方法推广至平面波基组对深度学习电子结构计算的未来发展具有重要的意义。

比传统方法快几个数量级

为了解决以上问题,清华研究团队提出了一种基于PW DFT结果的实空间重构方法来重构AO哈密顿量。该方法比直接投影PW哈密顿量或波函数的传统方法快几个数量级。

此外,研究表明,使用该方法生成的AO哈密顿量不仅可以很好地再现PW电子结构,而且非常容易被神经网络模型学习。因此,解决了PW基下的深度学习DFT哈密顿量的关键问题。新方法的高精度和高效性有利于构建更通用、更准确的深度学习电子结构计算方法,这不仅使它们能够为更广泛的科学界所使用,而且极大地提高了它们在一般应用中的适用性。

图1 | PW基下的深度学习DFT哈密顿量的思想及其在旋转双层石墨烯中的应用。

将PW汉密尔顿量转换为AO基组的三种方法

该方法的实际工作流程为:一组小型非扭曲结构的PW DFT结果用于在AO基下重构汉密尔顿量。然后可以推广在这些重构汉密尔顿量上训练的神经网络来预测大型扭曲结构的汉密尔顿量。

PW汉密尔顿量和AO汉密尔顿量实际上是在不同基组下表达的相同物理量。原则上,一旦有了PW汉密尔顿量

,就可以通过改变基组来获得相应的AO汉密尔顿量

,然后当前的AO汉密尔顿量神经网络可以灵活地学习该AO汉密尔顿量。

在此,研究人员简要讨论了将PW汉密尔顿量转换为AO基组的三种方法。

投影(projectio)方法被广泛用于弥合PW和AO之间的差距。其最初是为了评估AO基组的质量而开发的,投影方法可以修改为直接将哈密顿量从PW基转换为AO基:

这里,PW基在Born–von Kármán(BvK)超晶胞中被归一化:

,其中,k是第一布里渊区中的波矢,G是倒格矢,N是形成BvK超晶胞的原始晶胞数,Ω是原始晶胞的体积。AO基函数|ϕiα〉以原子i为中心。可能有多个基函数(标记为n)共享相同的角动量量子数l和磁量子数m。指标α是n、l、m的缩写。

方程(1)被称为Hk(G, G′)投影法。

如果得到了PW哈密顿量的特征值εnk和波函数|ψnk〉,则方程(1)可以进一步写成:

方程(2)被称为ψnk(G)投影法。

虽然方程(1)和(2)是将PW哈密顿量转换为AO基的直接方法,但它们的计算效率较低。此外,它们都相对于系统中的原子数量以立方比例缩放,这限制了它们的应用范围。

事实上,可以利用实空间中的局部性来大大加快计算速度。原子单位下的实空间中的哈密顿量为:

其中,各个项分别对应于动能、Hartree势、交换关联势以及伪势的局部和非局部部分。本研究仅考虑交换和关联的半局部函数。方括号中的三个项称为总有效局部势:

,它在单位晶胞上是周期性的。一旦有了H(r, r′),就可以直接在实空间中计算AO哈密顿量,如下所示:

该方法称为实空间重构方法。

尽管它们在理论上是等效的,并且在收敛时会产生相同的结果,但所提出的实空间重构方法比前两种基于投影的方法效率高得多。

两个研究案例应用于扭曲双层石墨烯

深度学习DFT汉密尔顿量方法最显著的能力是神经网络模型可以在小结构上进行训练,并推广到预测更大结构的汉密尔顿量。

在双层石墨烯的研究中,训练集由300个4×4双层石墨烯超晶胞组成,这些超晶胞具有不同的堆叠和每个原子位置的随机扰动。研究人员在根据PW DFT结果重建的AO汉密尔顿量训练神经网络模型后,可以使用该模型系统地研究具有任意扭曲角度的莫尔扭曲超结构。

首先,在训练集的一个结构上对重建的哈密顿量进行基准测试,将其能带结构与使用PW计算的能带结构绘制在一起。如图1c所示,两个能带结构非常吻合。

在训练神经网络模型后,用它来研究众所周知的「魔角」扭曲双层石墨烯,θ=1.08°,莫尔超晶胞中有11,164个原子。有了深度学习DFT哈密顿量方法,计算成本可以大大降低。如图1d所示,与PW DFT基准相比,在重建的AO哈密顿量上训练的神经网络能够给出非常准确的预测,误差仅为几毫电子伏。

此外,当使用从PW DFT输出重建的AO汉密尔顿量训练神经网络时,预测的能带结构(图1d中的PW-NN)与Lucignano等人的PW DFT结果相比,与使用AO DFT计算的汉密尔顿量(图1d中的AO-NN)训练神经网络的情况相比,具有更好的一致性。

这表明与PW DFT接口的深度学习汉密尔顿量确实可以给出更高精度的结果。这种高精度与PW方法的灵活性和广泛适用性相结合,将大大增强深度学习从头计算的能力,并将对未来的研究大有裨益。

应用于双层MoS₂

接下来,在双层MoS₂系统研究中比较了三种方法。首先,研究人员在由六个原子组成的AB堆叠双层晶胞上测试了重构方法,从重构的AO哈密顿量获得的能带结构与PW DFT结果非常吻合。然后,绘制了三种不同方法给出的能带结构,它们几乎相同,只是ψnk(G)投影方法给出的能带结构与其他两种方法略有不同,因为在方程(2)时仅使用了有限数量的能带。

图2 | 应用PW基下的深度学习DFT哈密顿量研究扭曲双层MoS2。

然后,进一步比较了三种方法的计算时间。正如预期的那样,两种基于投影的方法显示出大致的立方缩放。它们甚至比完全自洽场计算更耗时。相反,由于AO基的局部性,实空间重建方法实现了线性缩放,并且可以比投影方法快几个数量级。

研究人员表示:「我们工作的一个直接影响是,使深度学习电子结构方法适用于那些已经熟悉PW方法但在AO DFT方面经验较少的人。另一个有前途的未来应用是,建立通用的深度学习模型,可以处理不同类型的材料并准确预测它们的电子结构。」

论文链接:

https://www.nature.com/articles/s43588-024-00701-9

--Science AI

0 阅读:0

孤岚和科技

简介:感谢大家的关注