智能计算模拟: DFT+MD+ML 深度融合及科研实践-程序员宅基地

技术标签: 学习  数据分析  数据库  数据挖掘  大数据  

第一性原理、分子动力学与机器学习三者的交汇融合已在相关研究领域展现强劲的研究热潮。借助第一性原理计算揭示材料内在的量子特性,并结合分子动力学模拟探究材料在实际环境下的动态行为;运用机器学习算法与上述方法结合,开发高性能预测模型与模拟工具,能有效缩短研发周期,降低计算成本,实现对新型化合物性质的高精度预测。

“ 第一性原理+ 分子动力学+ 机器学习”三位一体的综合手段 ,已经成为模拟计算的一个前沿方向,为解决传统计算化学方法面临的挑战提供了新的解决方案。国内外已有科研团队在深化第一性原理与分子动力学的研究与应用拓展,利用机器学习优化大规模计算、快速筛选潜在功能材料等方面取得重要突破。尤其是在国家创新驱动发展战略的引领下,越来越多的科研项目聚焦于如何利用人工智能手段解决能源、环保、医药等重大领域的核心问题。 这一前沿交叉领域的研究发展趋势呈现出高度集成化、智能化的特点,为我国科技创新注入源源不断的活力。

前沿性与实用性并重 : 全面涵盖 DFT/MD/ML 三大计算方法以及相互结合使用的经典案例实践及最新研究分享。探讨如何利用“DFT+MD+ML”三位一体技术解决催化、药物设计等领域的核心问题,促进科研成果产业化进程。

智能计算模拟: DFT+MD+ML 深度融合及科研实践

DFT+MD+ML基础

    1. 理论内容: 理论内容:

1.1. 计算模拟发展:MD, MC, DFT三大部分

1.2. 人工智能时代背景: 大数据与大模型对模拟计算的影响

1.3. 人工智能加入给传统模拟计算带来的哪些变化?

① 模型建构的新趋势

② 力场开发中的机器学习应用

③ AI 在模拟过程优化与加速中的作用

④ 数据后处理技术的发展与智能化

1.4. 统计物理基本理论(系综、边界条件、温度的定义、控温与热浴等)

  1. 实例操作

2.1. 软件环境搭建与安装: conda配置虚拟环境,安装GPUMD、LAMMPS、ASE、Phono3PY、PyNEP、 OVITO、VMD、ATOMSK等软件

2.2. 力场参数生成与MD模拟操作: 综合使用MS软件+MSI2LMP快速生成任意有机分子的PCFF/CVFF力场参数文件,并使用LAMMPS软件执行分子动力学模拟

2.3. MS软件的基本介绍与LAMMPS结合使用

a. MSI2LMP 与 PCFF /CVFF 力场的简介

b. LAMMPS 入门与经验势使用

c. 简单的分子动力学计算

2.4. 高精度量化数据集 获取与机器学习融入MD模拟

a. VASP 计算静态与 AIMD 的参数设置

b. 简单的力场计算实践、LAMMPS 的基本使用(机器学习势)

c. LAMMPS 与机器学习势函数结合的 MD 模拟

d. 机器学习模型的加载和使用要点

2.5. 数据后处理技术与可视化分析

a. 使用 OVITOs 的相关代码分析处理数据,包括 AIMD 和机器学习分子模拟的 RDF, MSD, 扩散系数以及键角和二面角的分布情况

b. OVITO 软件的基本使用

c. 键角和二面角分布的统计与绘图实现,以及 python 画图和 origin画图的双示例

机器学习力场学习与实践

  1. 理论内容:

3.1. 机器学习力场的重要工作

3.2. 机器学习、神经网络核心原理和训练过程

3.3. 机器学习力场构建流程、应用与优势

3.4. 图神经网络和图卷积网络

a. GNN/GCN 概述、SchNet 模型特点与实现

b. 消息传递神经网络框架

c. GAP、MTP、ACE、DP、NEP 模型深入探讨与对比

3.5. DeePMD在国内的研究与应用现状

3.6. 高性能机器学习力场模型介绍

3.7. NEP+GPUMD系列研究解读

  1. 实例操作( NEP+GPUMD 集成实战:全流程模型构建与模 拟):

4.1. 数据格式转换与数据集构建: 使用公开代码工具转化数据格式,并生成训练,验证和测试数据集

4.2. NEP模型超参数设定与理解

4.3. NEP模型全流程操作:安装、准备数据集、训练、验证和测试

4.4. 使用LAMMPS和GPUMD模型执行高精度、高效率、大规模分子动力学模拟

4.5. 4.5. 机器学习力场驱动的模拟数据后处理与分析

机器学习力场等变模型系列及领域热点

  1. 理论内容

5.1. MACE模型:融合ACE、消息传递与等变性的创新

5.2. 方法的完备性,效率和系列演进

5.3. 适用于大规模GPU并行框架的NEP模型

5.4. 主流机器学习力场模型的详析与对比

  1. 实例操 作:(以石墨烯等二维材料为例,深度探究 MACE 及其他 ML 力场模型的实践应用)

6.1. NequIP或MACE模型超参数设置与实际应用

6.2. 结合LAMMPS或ASE使用MACE模型构建势函数

6.3. MACE与DeePMD、NEP的精度、数据效率对比

6.4. 计算RDF、MSD、扩散系数等物性并重现文献结果

6.5. 构建及对比DP、NEP、ACE等多种ML力场模型

数据收集方法与应用

  1. 理论部分

7.1. 公开数据集资源

7.2. 数据增强技术

a. 主动学习技术

b. AIMD+微扰等数据集扩充手段

c. 数据集数据集精简与筛选策略

d. 模型微调技术

  1. : 实例操作:( ( 主动学习 与模型微调在计算模拟中的实践 – 液态水、 SiO2、 、 MOF的完全演示案例) )

8.1. ASE 环境下主动学习实现与代码解析

8.2. 多 GPU 并行或单 GPU 多任务并行与资源优化

8.3. 自主设计主动学习方案

8.4. 预训练模型微调实践

8.5. 微调与从头训练效果对比

8.6. 不同模型(如金属、团簇、孪晶结构、多晶石墨烯)的构建实例

S 其他备选内容

S1. 其他机器学习内容拓展应用,DNN、DT、XGBoost 在计算模拟领域的应用,以多晶石墨烯为例

S2. PFC 相场方法建立多晶石墨烯、石墨烯晶界描述符的选取、深度神经网络的训练(与其他机器学习方法对比)、预测

S3. VMD 与 OVITO 等输出高质量的分子结构视觉化效果

在这里插入图片描述
在这里插入图片描述

版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。
本文链接:https://blog.csdn.net/y2715163545/article/details/137006709

智能推荐

获取大于等于一个整数的最小2次幂算法(HashMap#tableSizeFor)_整数 最小的2的几次方-程序员宅基地

文章浏览阅读2w次,点赞51次,收藏33次。一、需求给定一个整数,返回大于等于该整数的最小2次幂(2的乘方)。例: 输入 输出 -1 1 1 1 3 4 9 16 15 16二、分析当遇到这个需求的时候,我们可能会很容易想到一个"笨"办法:..._整数 最小的2的几次方

Linux 中 ss 命令的使用实例_ss@,,x,, 0-程序员宅基地

文章浏览阅读865次。选项,以防止命令将 IP 地址解析为主机名。如果只想在命令的输出中显示 unix套接字 连接,可以使用。不带任何选项,用来显示已建立连接的所有套接字的列表。如果只想在命令的输出中显示 tcp 连接,可以使用。如果只想在命令的输出中显示 udp 连接,可以使用。如果不想将ip地址解析为主机名称,可以使用。如果要取消命令输出中的标题行,可以使用。如果只想显示被侦听的套接字,可以使用。如果只想显示ipv4侦听的,可以使用。如果只想显示ipv6侦听的,可以使用。_ss@,,x,, 0

conda activate qiuqiu出现不存在activate_commandnotfounderror: 'activate-程序员宅基地

文章浏览阅读568次。CommandNotFoundError: 'activate'_commandnotfounderror: 'activate

Kafka 实战 - Windows10安装Kafka_win10安装部署kafka-程序员宅基地

文章浏览阅读426次,点赞10次,收藏19次。完成以上步骤后,您已在 Windows 10 上成功安装并验证了 Apache Kafka。在生产环境中,通常会将 Kafka 与外部 ZooKeeper 集群配合使用,并考虑配置安全、监控、持久化存储等高级特性。在生产者窗口中输入一些文本消息,然后按 Enter 发送。ZooKeeper 会在新窗口中运行。在另一个命令提示符窗口中,同样切换到 Kafka 的。Kafka 服务器将在新窗口中运行。在新的命令提示符窗口中,切换到 Kafka 的。,应显示已安装的 Java 版本信息。_win10安装部署kafka

【愚公系列】2023年12月 WEBGL专题-缓冲区对象_js 缓冲数据 new float32array-程序员宅基地

文章浏览阅读1.4w次。缓冲区对象(Buffer Object)是在OpenGL中用于存储和管理数据的一种机制。缓冲区对象可以存储各种类型的数据,例如顶点、纹理坐标、颜色等。在渲染过程中,缓冲区对象中存储的数据可以被复制到渲染管线的不同阶段中,例如顶点着色器、几何着色器和片段着色器等,以完成渲染操作。相比传统的CPU访问内存,缓冲区对象的数据存储和管理更加高效,能够提高OpenGL应用的性能表现。_js 缓冲数据 new float32array

四、数学建模之图与网络模型_图论与网络优化数学建模-程序员宅基地

文章浏览阅读912次。(1)图(Graph):图是数学和计算机科学中的一个抽象概念,它由一组节点(顶点)和连接这些节点的边组成。图可以是有向的(有方向的,边有箭头表示方向)或无向的(没有方向的,边没有箭头表示方向)。图用于表示各种关系,如社交网络、电路、地图、组织结构等。(2)网络(Network):网络是一个更广泛的概念,可以包括各种不同类型的连接元素,不仅仅是图中的节点和边。网络可以包括节点、边、连接线、路由器、服务器、通信协议等多种组成部分。网络的概念在各个领域都有应用,包括计算机网络、社交网络、电力网络、交通网络等。_图论与网络优化数学建模

随便推点

android 加载布局状态封装_adnroid加载数据转圈封装全屏转圈封装-程序员宅基地

文章浏览阅读1.5k次。我们经常会碰见 正在加载中,加载出错, “暂无商品”等一系列的相似的布局,因为我们有很多请求网络数据的页面,我们不可能每一个页面都写几个“正在加载中”等布局吧,这时候将这些状态的布局封装在一起就很有必要了。我们可以将这些封装为一个自定布局,然后每次操作该自定义类的方法就行了。 首先一般来说,从服务器拉去数据之前都是“正在加载”页面, 加载成功之后“正在加载”页面消失,展示数据;如果加载失败,就展示_adnroid加载数据转圈封装全屏转圈封装

阿里云服务器(Alibaba Cloud Linux 3)安装部署Mysql8-程序员宅基地

文章浏览阅读1.6k次,点赞23次,收藏29次。PS: 如果执行sudo grep 'temporary password' /var/log/mysqld.log 后没有报错,也没有任何结果显示,说明默认密码为空,可以直接进行下一步(后面设置密码时直接填写新密码就行)。3.(可选)当操作系统为Alibaba Cloud Linux 3时,执行如下命令,安装MySQL所需的库文件。下面示例中,将创建新的MySQL账号,用于远程访问MySQL。2.依次运行以下命令,创建远程登录MySQL的账号,并允许远程主机使用该账号访问MySQL。_alibaba cloud linux 3

excel离散度图表怎么算_excel离散数据表格-Excel 离散程度分析图表如何做-程序员宅基地

文章浏览阅读7.8k次。EXCEL中数据如何做离散性分析纠错。离散不是均值抄AVEDEV……=AVEDEV(A1:A100)算出来的是A1:A100的平均数。离散是指各项目间指标袭的离散均值(各数值的波动情况),数值较低表明项目间各指标波动幅百度小,数值高表明波动幅度较大。可以用excel中的离散公式为STDEV.P(即各指标平均离散)算出最终度离散度。excel表格函数求一组离散型数据,例如,几组C25的...用exc..._excel数据分析离散

学生时期学习资源同步-JavaSE理论知识-程序员宅基地

文章浏览阅读406次,点赞7次,收藏8次。i < 5){ //第3行。int count;System.out.println ("危险!System.out.println(”真”);System.out.println(”假”);System.out.print(“姓名:”);System.out.println("无匹配");System.out.println ("安全");

linux 性能测试磁盘状态监测:iostat监控学习,包含/proc/diskstats、/proc/stat简单了解-程序员宅基地

文章浏览阅读3.6k次。背景测试到性能、压力时,经常需要查看磁盘、网络、内存、cpu的性能值这里简单介绍下各个指标的含义一般磁盘比较关注的就是磁盘的iops,读写速度以及%util(看磁盘是否忙碌)CPU一般比较关注,idle 空闲,有时候也查看wait (如果wait特别大往往是io这边已经达到了瓶颈)iostatiostat uses the files below to create ..._/proc/diskstat

glReadPixels读取保存图片全黑_glreadpixels 全黑-程序员宅基地

文章浏览阅读2.4k次。问题:在Android上使用 glReadPixel 读取当前渲染数据,在若干机型(华为P9以及魅族某魅蓝手机)上读取数据失败,glGetError()没有抓到错误,但是获取到的数据有误,如果将获取到的数据保存成为图片,得到的图片为黑色。解决方法:glReadPixels实际上是从缓冲区中读取数据,如果使用了双缓冲区,则默认是从正在显示的缓冲(即前缓冲)中读取,而绘制工作是默认绘制到后缓..._glreadpixels 全黑