MPI并行程序中通信等待问题的诊断方法及其应用
TP316.4; 随着并行规模的扩大,现有通信等待问题的诊断方法存在内存开销大、测量时间开销大等问题.通过对现有通信等待问题诊断方法的深入分析,同时考虑测量开销可控的实际需求,建立基于热点函数的通信等待问题诊断模型.基于上述模型,总结出一种更精简、更实用的通信等待问题诊断方法.将该诊断方法分别应用到二维LARED集成、LARED-S、LAP3D等大规模MPI并行程序的通信等待问题诊断过程,应用效果表明本诊断方法可精确定位导致通信等待问题的关键代码段,给出的优化方案及性能提升空间对于后续的程序改进具有参考价值,其中根据诊断结果优化后的LARED-S程序性能提升32%,通信等待时间减少44%....
Saved in:
Published in | 国防科技大学学报 Vol. 42; no. 2; pp. 47 - 54 |
---|---|
Main Authors | , , , |
Format | Journal Article |
Language | Chinese |
Published |
北京应用物理与计算数学研究所,北京,100094
28.04.2020
|
Subjects | |
Online Access | Get full text |
ISSN | 1001-2486 |
DOI | 10.11887/j.cn.202002006 |
Cover
Summary: | TP316.4; 随着并行规模的扩大,现有通信等待问题的诊断方法存在内存开销大、测量时间开销大等问题.通过对现有通信等待问题诊断方法的深入分析,同时考虑测量开销可控的实际需求,建立基于热点函数的通信等待问题诊断模型.基于上述模型,总结出一种更精简、更实用的通信等待问题诊断方法.将该诊断方法分别应用到二维LARED集成、LARED-S、LAP3D等大规模MPI并行程序的通信等待问题诊断过程,应用效果表明本诊断方法可精确定位导致通信等待问题的关键代码段,给出的优化方案及性能提升空间对于后续的程序改进具有参考价值,其中根据诊断结果优化后的LARED-S程序性能提升32%,通信等待时间减少44%. |
---|---|
ISSN: | 1001-2486 |
DOI: | 10.11887/j.cn.202002006 |