-
Notifications
You must be signed in to change notification settings - Fork 2
Description
一:rbmd概况
-
柯涵介绍一下目前MACE在dtk上的开发情况
未接入DCU版本 -
罗总介绍一下目前详细的测试情况,以及对下一步要添加功能模块的计划
-
茂瑛介绍一下目前输出模块的开发情况以及对更多case的
-
永发介绍一下当前多DCU卡的开发情况
-
秦老师介绍一下目前rbmd在DCU上的编译情况
完成---dtk的版本
未完成---vtkm -
刘欢介绍一下需要优化的地方
7.1 cmake 重构
7.2 工程文件需要调整一下目录
7.3 jsoncpp库换成nlohmann_json 库已解决json节点乱序的问题
7.4 支持配置文件读入
7.5 做全局性能测试,优化性能,比如将thrust::copy改为流式异步拷贝cudaMemcpyAsync
7.6 性能测试框架
7.7 单元测试框架
二:需要讨论的一些问题
-
计算势能会降低计算规模
-
后处理慢,是否考虑分开
-
版本号的管理
4.test
Loop time of 8.80234 on 10 procs for 10000 steps with 300 atoms
Performance: 49.078 ns/day, 0.489 hours/ns, 1136.061 timesteps/s, 340.818 katom-step/s
85.9% CPU use with 10 MPI tasks x 1 OpenMP threads
MPI task timing breakdown:
Section | min time | avg time | max time |%varavg| %total
Pair | 0.50086 | 1.0206 | 1.502 | 31.1 | 11.59
Bond | 0.002867 | 0.0033064 | 0.003995 | 0.6 | 0.04
Kspace | 4.8298 | 5.3189 | 5.8095 | 13.3 | 60.43
Neigh | 0.074771 | 0.076574 | 0.078602 | 0.5 | 0.87
Comm | 0.90981 | 0.96438 | 1.0051 | 2.9 | 10.96
Output | 0.37877 | 0.3869 | 0.43137 | 2.4 | 4.40
Modify | 0.98187 | 0.99748 | 1.0366 | 1.4 | 11.33
Other | | 0.03423 | | | 0.39
Nlocal: 30 ave 46 max 18 min
Histogram: 2 3 1 0 0 0 1 0 0 3
Nghost: 2066.9 ave 2283 max 1838 min
Histogram: 1 1 1 1 1 0 1 1 2 1
Neighs: 5826.8 ave 10435 max 3294 min
Histogram: 2 3 0 2 0 1 0 1 0 1
Total # of neighbors = 58268
Ave neighs/atom = 194.22667
Ave special neighs/atom = 2
Neighbor list builds = 500
Dangerous builds not checked
#write data file
#write_data H2O_300_v.data
Total wall time: 0:00:08