人工智能与传统计算机模拟结合是当今科学计算的一大趋势,机器学习力场作为其中的一个重要方向,能够显著提升分子动力学模拟的精度和效率。PWMLFF是一套由龙讯旷腾团队开发,在 GNU 许可下的开源软件包,用于快速生成媲美从头算分子动力学(AIMD)精度的机器学习力场。本次发布的PWMLFF 2024.3版本,包含Lammps的libtorch接口方案、主动学习平台、数据处理平台等一系列更新。现PWMLFF包括模型训练平台、Lammps分子动力学接口、主动学习平台、数据格式转换工具、数据和模型仓库以及用户手册。
1. PWMLFF用户手册
http://doc.lonxun.com/PWMLFF/
PWMLFF用户手册提供了详细的PWMLFF工具集安装、使用以及案例说明文档。通过阅读PWMLFF手册,用户可以快速了解和上手整套PWMLFF工具包。
2. PWMLFF机器学习平台
ttps://github.com/LonxunQuantum/PWMLFF
tag: 2024.3
PWMLFF 机器学习平台用于快速生成媲美从头算分子动力学(AIMD)的机器学习力场。支持8种常见描述符、4种机器学习模型以及两种训练优化器。
特点
集成不同特征与模型,可自由组合
对于扩展系统,PWMLFF假设系统的总能量是系统中每个原子能量的总和。PWMLFF用不同的局域原子描述符(即所谓“特征”)来描述局部原子结构,以这些特征作为回归模型的输入,拟合原子能量。PWMLFF支持的回归模型包括线性模型、神经网络(NN)模型和深度势能(Deep Potential)模型。PWMLFF包含了8种常用特征,用户可以将它们与几种模型任意组合使用。
Energy Decomposition
PWMLFF另一个独特功能是可以结合PWmat分子动力学计算中的能量分解功能,将局域的原子能量作为输入。由于局域原子能量可以直接作为数据输入回归模型,这可以显著减少训练所需的分子动力学步数,因此可以克服机器学习力场需要长时间预运算来产生训练数据这一困难。在PWMLFF中,总能量、局域原子能量和原子受力均可以作为训练标签输入。
Kalman Filter优化器加速训练
PWMLFF 支持常用优化器Adam以及扩展Kalman滤波优化器(EKF),这是一种训练收敛速度比Adam等优化器更快的一阶梯度优化器,然而往往需要占用更多的内存/显存。龙讯旷腾团队创造性得采用了分层计算的方式(RLEKF,https://ojs.aaai.org/index.php/AAAI/article/view/25957),使用块对角矩阵来近似稠密加权误差协方差矩阵,解决了此类优化器在计算中显存占用太多的问题。实验证明,RLEKF训练方式相比于Adam优化器精度更高,速度更快。
简单易上手的操作界面
PWMLFF 提供了从源码安装、离线安装两种方式供用户选择。此外,对于Mcloud用户,我们在Mcloud集成了PWMLFF的所有软件包,实现了“一条命令”即可加载。针对复杂的训练输入,PWMLFF采用了常见的JSON文件配置方式,并尽可能精简用户输入参数。用户只需类似如下例所示的简单配置,即可实现大多数模型训练。
PWMLFF 输入示例
{
“model_type”: “DP”,
“atom_type”: [14],
“datasets_path”: [“./PWdata”]
}
3. PWMLFF分子动力学接口
https://github.com/LonxunQuantum/Lammps_for_PWMLFF/tree/libtorch
tag:2024.3
PWMLFF提供了与分子动力学计算软件lammps的无缝集成接口,支持常见的NVE、NVT、NPT等多种系综设置。该接口不仅支持常规的CPU计算,还实现了GPU多卡加速能力,能高效利用多块GPU卡进行大规模并行加速。此外,调用PWMLFF模型的操作方式也更通用(如下lammps输入文件所示)。
4. PWact主动学习平台(支持 pip install pwact)
https://github.com/LonxunQuantum/PWact
由于机器学习方法的插值特性,对于训练集之外的相空间,MLFF 很难做出准确预测。训练数据通常是使用昂贵的第一性原理计算生成的,现实中很难获取到大量的从头算数据集,生成具有足够代表性的训练数据但不依赖大量从头算数据,对于提升模型的外推能力至关重要。
主动学习的一般性流程包括训练、构型探索以及标注。首先,训练模块做力场训练;之后探索模块调用力场模型做分子动力学模拟,模拟结束后把得到的分子运动轨迹送入查询器做不确定性度量;查询完成后,把待标注构型点送入标注模块;最后标注模块做自洽计算,得到能量和力作为标签,加入已标注数据库中;重复上述步骤,直到收敛。
PWact是开源的基于 PWMLFF 的一套自动化主动学习平台,用于高效的自动化主动学习采样,快速制备PWMLFF力场训练数据。PWact安装和操作简单易学,支持源码安装和更加便捷的pip 命令(pip install pwact)安装两种方式,使用JSON文件作为输入控制。PWact包括初始训练数据制备以及主动学习两大功能。通过简单的JSON文件配置,即可实现初始训练数据制备和主动学习过程中的计算任务生成、调度、监控、故障恢复以及结果收集自动化。支持PWmat、VASP、CP2K、DFTB(PWmat集成,🔗)等常用第一性原理程序。
5. 结构转换工具PWdata(支持 pip install pwdata)
https://github.com/LonxunQuantum/pwdata
PWdata是一款数据转换工具,能够快捷地实现PWmat、VASP、CP2K之间的结构格式互转,支持各类结构到PWMLFF力场数据格式转换。PWdata支持源码安装和pip命令安装(pip install pwdata)两种方式,简便易用。
6. 训练数据集仓库
https://github.com/LonxunQuantum/PWMLFF_library
百度网盘下载:
https://pan.baidu.com/s/1uO4mLgPha1mMD6DsZuCN_g?pwd=pwmt
AIMD数据的高昂制备成本一直是限制机器学习力场的瓶颈之一,我们在该数据仓库中上传了常见体系的AIMD 数据集、一些已训练的PWMLFF 模型、常用的不同版本模型转换脚本。便于用户快速复用已有数据集和模型或进行不同模型之间的横向比较,帮助用户节省数据制备和模型训练成本。
客服微信
Copyright (c) 2020.北京龙讯旷腾科技有限公司 All rights reserved.京ICP备15057729号