富岳における高プロセス並列ジョブのメモリ消費について

MPIに基づいて並列化したジョブでプロセス数が多いものを富岳で実行したときの挙動を調べた.特に,ジョブのメモリ消費量の変化に注目する.MPIプロセス数が大きい場合,MPIの初期化の実行で少なくないメモリ消費が発生,増加していく.並列化度がさらに大きくなると,ジョブは最終的にメモリ枯渇に至る.その結果我々は,富岳で全系実行を行う場合でも実現できるMPI並列数は最大で約350万であることを明らかにした.MPIの並列度数は使用する計算ノード数に応じて設定する必要があるが,富岳の大規模ジョブとして実行する場合,ユーザーのコードに明示的に記述して利用できるメモリがかなり制限されることに注意が必要であるこ...

Full description

Saved in:
Bibliographic Details
Published in日本シミュレーション学会論文誌 Vol. 15; no. 2; pp. 56 - 63
Main Authors 中野, 博生, 轟木, 義一, 多田野, 寛人
Format Journal Article
LanguageJapanese
Published 日本シミュレーション学会 2023
Subjects
Online AccessGet full text

Cover

Loading…
More Information
Summary:MPIに基づいて並列化したジョブでプロセス数が多いものを富岳で実行したときの挙動を調べた.特に,ジョブのメモリ消費量の変化に注目する.MPIプロセス数が大きい場合,MPIの初期化の実行で少なくないメモリ消費が発生,増加していく.並列化度がさらに大きくなると,ジョブは最終的にメモリ枯渇に至る.その結果我々は,富岳で全系実行を行う場合でも実現できるMPI並列数は最大で約350万であることを明らかにした.MPIの並列度数は使用する計算ノード数に応じて設定する必要があるが,富岳の大規模ジョブとして実行する場合,ユーザーのコードに明示的に記述して利用できるメモリがかなり制限されることに注意が必要であることも明らかにした.
ISSN:1883-5031
1883-5058
DOI:10.11308/tjsst.15.56