MPI并行程序中通信等待问题的诊断方法及其应用

TP316.4; 随着并行规模的扩大,现有通信等待问题的诊断方法存在内存开销大、测量时间开销大等问题.通过对现有通信等待问题诊断方法的深入分析,同时考虑测量开销可控的实际需求,建立基于热点函数的通信等待问题诊断模型.基于上述模型,总结出一种更精简、更实用的通信等待问题诊断方法.将该诊断方法分别应用到二维LARED集成、LARED-S、LAP3D等大规模MPI并行程序的通信等待问题诊断过程,应用效果表明本诊断方法可精确定位导致通信等待问题的关键代码段,给出的优化方案及性能提升空间对于后续的程序改进具有参考价值,其中根据诊断结果优化后的LARED-S程序性能提升32%,通信等待时间减少44%....

Full description

Saved in:
Bibliographic Details
Published in国防科技大学学报 Vol. 42; no. 2; pp. 47 - 54
Main Authors 武林平, 景翠萍, 刘旭, 田鸿运
Format Journal Article
LanguageChinese
Published 北京应用物理与计算数学研究所,北京,100094 28.04.2020
Subjects
Online AccessGet full text
ISSN1001-2486
DOI10.11887/j.cn.202002006

Cover

More Information
Summary:TP316.4; 随着并行规模的扩大,现有通信等待问题的诊断方法存在内存开销大、测量时间开销大等问题.通过对现有通信等待问题诊断方法的深入分析,同时考虑测量开销可控的实际需求,建立基于热点函数的通信等待问题诊断模型.基于上述模型,总结出一种更精简、更实用的通信等待问题诊断方法.将该诊断方法分别应用到二维LARED集成、LARED-S、LAP3D等大规模MPI并行程序的通信等待问题诊断过程,应用效果表明本诊断方法可精确定位导致通信等待问题的关键代码段,给出的优化方案及性能提升空间对于后续的程序改进具有参考价值,其中根据诊断结果优化后的LARED-S程序性能提升32%,通信等待时间减少44%.
ISSN:1001-2486
DOI:10.11887/j.cn.202002006