| 本文介绍了关嘉麒&Wesley Wei Qian团队发表在ICLR 2022的文章《ENERGY-INSPIRED MOLECULAR CONFORMATION OPTIMIZATION》。作者研究如何预测分子的空间原子排列或分子构象,提出了一个神经能量最小化的概念。他将预测问题归结为一个展开的优化过程,并将神经网络参数化来学习隐式构象能量场的梯度空间。假设底层势能有不同的函数表达式,作者可以重新解释并统一许多现有的模型,还可以有原则地推导出SE(3)-equivariant神经网络的新变体。 1.介绍3D分子构象是决定分子很多物理化学和生物特征的最重要的特征之一。在考虑化学反应和相互作用的空间约束或电子效应时,分子的3D电荷分布和物理形状至关重要。因此,分子构象被广泛应用在定量结构活性关系(QSAR)评估和药物发现中。随着对虚拟药物筛选和de novo 药物设计的关注度日益提高,目前更需要快速准确地预测分子构象以得到其3D 几何特征。 最近,深度学习技术被引入来解决并且取得了理想的结果。例如,生成模型被提出首先生成原子对的配对距离,然后从这类矩阵中推导出构象体。因为3D结构是间接生成的,所以第二步中对于估计距离的误差很敏感,可能需要额外的模型来编码冗余量。与此同时,出现了许多SE(3)-equivariant网络来处理3D旋转对称的输入,使其能够直接三维笛卡尔坐标。最近这类模型最成功的应用是用于蛋白质结构预测的AlphaFold系统。尽管有许多好处,然而现有的SE(3)-equivariant网络要么来自需要昂贵系数计算的复杂数学理论,要么是基于消息传递直觉的启发式计算。 作者提出了一种全新的方法,将分子构象预测展开为固定数量的优化步骤,其中神经网络被参数化来学习隐式构象能量场的梯度空间。在此方法中,该模型可以将一个给定的构象体向更稳定和能量优先的状态去优化。作者不仅可以重新解释现有模型,而且可以从构象能量函数的假设中推导出SE(3)-equivariant模型的新变体,使得模型的结构与其物理假设保持一致。通过实验发现,这些新变体与其它SE(3)等模型相比,在构象体优化方面的性能表现更好。此外,作者提出的优化方法也适用于构象体的生成,可以生成多样且准确的构象体。 此论文的主要贡献包括:
2.方法分子构象代表了原子的3D排列,与构象能量联系紧密。因为分子构象的每个平衡点都可以被视为势能表面的局部最小值。因此可以通过梯度下降找到这些稳定结构,因为这是一个能量最小化的过程。具体地,给定一个特定的能量函数E,可以通过梯度下降更新3D直角坐标来优化构象体X,使得E最小化: 其中γ是学习率,我们可以观察到 为一个稳定结构。因此,如果能量函数E(X|)是完全表征的且对X可微,我们可以通过迭代应用梯度下降来更新,很容易地从初始构象体中找到一个稳定的分子构象。不幸的是,情况通常不是这样。 作者利用神经网络的计算能力,让它直接从中学习梯度场,而不是手工设计能量函数及其梯度。一旦网络被训练,就可以用该模型展开优化,并执行上述优化的神经版本,其中公式1中的梯度项E不是来自显式能量函数,而是由神经网络估计的。 对于所有∈X,∈和∈,其中φ是估计各自梯度场的神经网络,神经网络的精确参数将取决于能量函数。在这项工作中,为了简单起见,作者将视为一个常数表示,因此它在作者的模型中没有更新。 3.结果3.1分子构象优化如表1所示,所有的优化模型都可以改进由RDKit+MMFF估计的初始构象。从新框架中得到的新变体也明显优于两个最先进的SE(3)-equivariant模型。 如图2所示,作者的模型可以产生既实际而且能量稳定的结构体。在没有刻意设计的情况下,作者的模型预测的构象体也能很好地捕捉到基本成分的结构(例如,苯在同一平面上形成一个环)。对于初始构象体(RDKit+MMFF)没有以最稳定方式折叠/旋转的大分子,作者的模型也可以将构象体优化到稳定状态后来作为参考构象体。 如图3所示,可以发现由作者的模型预测的构象计算出的HOMO-LUMO间隙与参考构象吻合良好,而参考构象与力场优化构象之间的相关性却要低得多。在第二项研究中,作者针对QM9基准,用参考或预测的构象训练了一个标准的神经网络模型SchNet。如表2所示,用作者预测的构象体训练的模型优于其它预测构象体训练的模型。 3.2分子构象生成如表3所示,作者的模型在所有的指标上的表现都很有竞争力,特别是在更具挑战性的GEOM-QM9药物数据集上,本模型超过了所有的机器学习方法。这些结果表明,作者的优化公式可以很容易地到多样化且准确的构象集合的生成设置中。 4.总结和讨论本文提出了一种新的分子构象预测公式,通过参数化一个SE(3)-equivariant网络来模拟构象能量景观的梯度场。通过将SE(3)-equivariant模型与潜在的能量函数联系起来,作者还发现了一个新的视角,主要推导出SE(3)-equivariant模型的新变体,该模型与物理系统的一组明确的基本假设相一致。通过大量的实验,作者证明了所提出的方法能够优化一个给定的构象到其最能量稳定的状态,并有效地生成一个不同的和准确的构象的集合。这种受能量启发的视角也为思考SE(3)-equivariant模型提供了一个新的方向,并期望社区通过更适合其应用的能量假设得出更有趣的变体。 对于未来的工作,作者的兴趣也超出了小分子的构象,因为作者可以进一步扩大系统规模来模拟更大的生物分子系统,如蛋白质-配体复合物。此外,探索像DEQ这样对平衡状态直接建模的模型也是很有趣的。由于作者的训练目标对手性是盲目的,系统将需要在模型生成后推断手性,而作者能否构建内置手性的系统仍然是一个有趣的问题。最后,由于具有快速生成高质量分子构象集成的能力,作者也对使用构象集成的分子机器学习很感兴趣。 参考资料Guan, J., Qian, W.W., Ma, W.Y., Ma, J. and Peng, J., 2021, September. Neural Energy Minimization for Molecular Conformation Optimization. In International Conference on Learning Representations. 代码https://github.com/guanjq/confopt_official |
ICLR 2022 | 能量启发的分子构象优化
本文介绍了关嘉麒Wesley Wei Qian团队发表在ICLR 2022的文章《ENERGY-INSPIRED MOLECULAR CONFORMATION OPTIMIZATION》。作者研究如何预测分子的空间原子排列或分子构象,提出了一个神经能量最小化的概念。他将预测 .....
这篇内容能帮你快速理解什么
通过更完整的主题说明和结构表达,帮助用户更快抓住重点,也让搜索系统更容易识别页面主题。
让访问者快速理解当前问题、可行方法以及下一步应该继续看案例、看服务还是直接沟通。
文章页不只是获取流量,也承担继续阅读、查看服务和发起咨询的承接作用。
继续了解这个主题前,你可能还关心这些问题
为什么这类主题适合写成文章?
因为很多用户会通过问题词、对比词和方案词进入网站,文章页越清楚,越容易覆盖更具体的需求。
为什么文章页不能只有正文?
仅有正文不利于继续浏览和转化,文章页还需要总结、问答、相关推荐与咨询入口来承接用户。
看完之后下一步可以做什么?
可以继续看同类文章、服务页与案例页,也可以直接沟通官网升级与搜索优化需求。
这篇文章能帮助我解决什么具体问题?
这篇文章围绕当前主题提供了详细的解决方案、操作步骤和注意事项,帮助你快速理解核心要点并应用到实际场景中。
如何判断这篇文章的内容是否权威可靠?
内容基于实际项目经验和技术实践编写,结合行业标准和最佳实践,同时提供案例数据和方法论支撑,确保专业性和可操作性。
这类内容对SEO和网站排名有什么帮助?
优质的长文内容和FAQ结构能够提升页面主题相关性、增加用户停留时间、降低跳出率,这些都有助于搜索引擎评估页面质量并提升排名表现。
AI搜索引擎会如何理解和引用这类内容?
AI搜索系统会提取文章的实体信息、观点结论和结构化问答,当用户提出相关问题时,可能会引用本文作为答案来源或参考依据。
如果我有更多相关问题可以咨询谁?
可以通过页面底部的联系方式直接咨询我们的专业团队,包括电话、QQ或在线表单,我们会根据你的具体情况提供针对性的建议和方案。
这篇文章和同类内容有什么不同之处?
本文不仅提供理论知识,还包含实战经验、避坑指南和可执行的行动建议,同时兼顾传统SEO和新兴的GEO生成式搜索优化视角。
多久需要更新一次这类内容以保持时效性?
建议每季度审查并更新一次关键数据和案例,如果涉及技术工具或算法变化则需要更频繁地维护,确保内容持续为用户提供准确价值。